Con dao hai lưỡi của trí tuệ nhân tạo: Mô hình ngôn ngữ không giới hạn và mối đe dọa tiềm tàng đối với ngành mã hóa
Với sự phát triển nhanh chóng của công nghệ trí tuệ nhân tạo, từ các mô hình trong series GPT đến Gemini và nhiều mô hình tiên tiến khác, đã thay đổi sâu sắc cách chúng ta làm việc và sinh hoạt. Tuy nhiên, đằng sau những tiến bộ công nghệ này, một vấn đề đáng lo ngại cũng đang dần hiện rõ - sự xuất hiện của các mô hình ngôn ngữ lớn không bị hạn chế hoặc có tính chất ác ý và những rủi ro tiềm ẩn của chúng.
Mô hình ngôn ngữ không giới hạn đề cập đến những mô hình ngôn ngữ được thiết kế, chỉnh sửa hoặc "bẻ khóa" một cách có chủ đích để tránh các cơ chế an toàn và giới hạn đạo đức được tích hợp trong các mô hình chính thống. Mặc dù các nhà phát triển chính thống thường đầu tư rất nhiều nguồn lực để ngăn chặn việc mô hình bị lạm dụng để tạo ra nội dung độc hại hoặc cung cấp hướng dẫn bất hợp pháp, nhưng trong những năm gần đây, một số cá nhân hoặc tổ chức vì mục đích không đúng đã bắt đầu tìm kiếm hoặc tự phát triển các mô hình không bị ràng buộc. Bài viết này sẽ khám phá các trường hợp điển hình của các mô hình ngôn ngữ không giới hạn này, phân tích các cách lạm dụng tiềm năng của chúng trong ngành mã hóa, và thảo luận về các thách thức an toàn liên quan và các chiến lược ứng phó.
Mối đe dọa từ mô hình ngôn ngữ không giới hạn
Các nhiệm vụ trước đây cần kỹ năng chuyên môn để hoàn thành, như viết mã độc, tạo email lừa đảo hay lập kế hoạch lừa đảo, giờ đây nhờ vào các mô hình ngôn ngữ không giới hạn, ngay cả những người bình thường không có kinh nghiệm lập trình cũng có thể dễ dàng bắt tay vào. Kẻ tấn công chỉ cần lấy trọng số và mã nguồn của mô hình mã nguồn mở, sau đó sử dụng bộ dữ liệu chứa nội dung độc hại, phát ngôn thiên lệch hoặc chỉ dẫn bất hợp pháp để tinh chỉnh, từ đó có thể tạo ra công cụ tấn công tùy chỉnh.
Mô hình này mang lại nhiều rủi ro:
Kẻ tấn công có thể "tùy chỉnh" mô hình nhằm vào mục tiêu cụ thể, tạo ra nội dung lừa đảo hơn, vượt qua việc kiểm duyệt nội dung và hạn chế an ninh của mô hình thông thường.
Mô hình có thể được sử dụng để nhanh chóng tạo ra các biến thể mã của trang web lừa đảo, hoặc tùy chỉnh nội dung lừa đảo cho các nền tảng xã hội khác nhau.
Tính khả dụng và khả năng sửa đổi của các mô hình mã nguồn mở đã thúc đẩy sự hình thành và lan rộng của hệ sinh thái AI ngầm, tạo ra môi trường thuận lợi cho các giao dịch và phát triển bất hợp pháp.
Mô hình ngôn ngữ không giới hạn điển hình và khả năng lạm dụng tiềm ẩn
Một mô hình ngôn ngữ độc hại
Đây là một mô hình ngôn ngữ độc hại được bán công khai trên các diễn đàn ngầm, nhà phát triển tuyên bố rõ ràng rằng nó không có bất kỳ giới hạn đạo đức nào. Nó dựa trên một số mô hình mã nguồn mở và được đào tạo trên một lượng lớn dữ liệu liên quan đến phần mềm độc hại. Người dùng chỉ cần trả một khoản phí thấp là có thể có quyền sử dụng. Mục đích tai tiếng nhất của mô hình này là tạo ra các email tấn công xâm nhập thương mại và email lừa đảo với độ chân thực cao và tính thuyết phục.
Trong các hình thức lạm dụng điển hình trong bối cảnh mã hóa bao gồm:
Tạo email/thông tin lừa đảo: Bắt chước các sàn giao dịch mã hóa, ví hoặc các dự án nổi tiếng để gửi yêu cầu "xác minh tài khoản" đến người dùng, dụ họ nhấp vào liên kết độc hại hoặc tiết lộ khóa riêng/mnemonics.
Viết mã độc: Hỗ trợ những kẻ tấn công có trình độ kỹ thuật thấp viết mã độc với các chức năng như đánh cắp tệp ví, giám sát clipboard, ghi lại bàn phím.
Kích hoạt lừa đảo tự động: Tự động trả lời các nạn nhân tiềm năng, hướng dẫn họ tham gia vào các airdrop giả mạo hoặc dự án đầu tư.
một mô hình nội dung trên dark web
Đây là một mô hình ngôn ngữ được đào tạo trước đặc biệt trên dữ liệu từ mạng tối (như diễn đàn, chợ đen, tài liệu bị rò rỉ), với mục đích giúp các nhà nghiên cứu an ninh mạng và các cơ quan thực thi pháp luật hiểu rõ hơn về hệ sinh thái mạng tối, theo dõi các hoạt động bất hợp pháp, nhận diện các mối đe dọa tiềm ẩn và thu thập thông tin tình báo về các mối đe dọa.
Mặc dù mục đích thiết kế ban đầu là tích cực, nhưng dữ liệu nhạy cảm về mạng tối, phương thức tấn công, chiến lược giao dịch bất hợp pháp mà nó nắm giữ, nếu bị các tác nhân xấu thu thập hoặc sử dụng công nghệ tương tự để huấn luyện mô hình lớn không giới hạn, hậu quả sẽ khó lường. Các hình thức lạm dụng tiềm năng trong bối cảnh mã hóa bao gồm:
Thực hiện lừa đảo chính xác: Thu thập thông tin của người dùng mã hóa và đội ngũ dự án, dùng cho lừa đảo xã hội.
Bắt chước thủ đoạn phạm tội: Nhái lại các chiến lược trộm tiền và rửa tiền đã trưởng thành trong dark web.
Một mô hình lừa đảo trực tuyến
Đây là một phiên bản nâng cấp với nhiều tính năng hơn của mô hình độc hại, chủ yếu được bán trên mạng tối và các diễn đàn hacker. Các phương thức lạm dụng điển hình trong bối cảnh mã hóa bao gồm:
Dự án mã hóa giả mạo: Tạo ra các tài liệu trắng, trang web, lộ trình và nội dung tiếp thị giống thật, được sử dụng để thực hiện ICO/IDO giả.
Tạo trang lừa đảo hàng loạt: Tạo nhanh các trang đăng nhập hoặc giao diện kết nối ví mô phỏng các sàn giao dịch mã hóa nổi tiếng.
Hoạt động của đội quân mạng xã hội: Tạo ra một lượng lớn bình luận và quảng cáo giả mạo, thúc đẩy mã thông báo lừa đảo hoặc bôi nhọ các dự án cạnh tranh.
Tấn công kỹ thuật xã hội: Chatbot này có thể bắt chước cuộc trò chuyện của con người, thiết lập lòng tin với người dùng không biết gì, khiến họ vô tình tiết lộ thông tin nhạy cảm hoặc thực hiện các hành động có hại.
Trợ lý AI không có ràng buộc đạo đức nào
Đây là một chatbot AI được xác định rõ ràng là không có giới hạn đạo đức, các cách lạm dụng điển hình trong bối cảnh mã hóa bao gồm:
Tấn công lừa đảo tinh vi: Tạo ra các email lừa đảo giả mạo rất giống thật, mạo danh các sàn giao dịch lớn để phát hành yêu cầu xác minh KYC giả, cảnh báo an ninh hoặc thông báo đóng băng tài khoản.
Tạo mã độc hại cho hợp đồng thông minh: Không cần kiến thức lập trình, kẻ tấn công có thể nhanh chóng tạo ra hợp đồng thông minh chứa cửa hậu ẩn hoặc logic lừa đảo, dùng cho các trò lừa đảo Rug Pull hoặc tấn công các giao thức DeFi.
Trình đánh cắp mã hóa đa hình: Tạo ra phần mềm độc hại có khả năng biến hình liên tục, dùng để đánh cắp tệp ví, khóa riêng và cụm từ hạt giống. Đặc điểm đa hình của nó khiến phần mềm an ninh dựa trên chữ ký truyền thống khó phát hiện.
Tấn công kỹ thuật xã hội: Kết hợp kịch bản lời nói được tạo ra bởi AI, kẻ tấn công có thể triển khai robot trên các nền tảng xã hội, dụ dỗ người dùng tham gia vào việc đúc NFT giả, airdrop hoặc các dự án đầu tư.
Lừa đảo giả mạo sâu sắc: Kết hợp với các công cụ AI khác, có thể được sử dụng để tạo ra giọng nói giả mạo của người sáng lập, nhà đầu tư hoặc giám đốc điều hành sàn giao dịch mã hóa, thực hiện lừa đảo qua điện thoại hoặc tấn công xâm nhập email thương mại.
một nền tảng truy cập không kiểm duyệt
Đây là một nền tảng cung cấp quyền truy cập vào nhiều mô hình ngôn ngữ khác nhau, bao gồm một số mô hình có ít kiểm duyệt hoặc hạn chế lỏng lẻo. Nó tự định vị như một cổng mở cho người dùng khám phá khả năng của các mô hình ngôn ngữ khác nhau, cung cấp các mô hình tiên tiến, chính xác nhất và không bị kiểm duyệt, nhằm mang lại trải nghiệm AI thực sự không bị hạn chế, nhưng cũng có thể bị kẻ xấu sử dụng để tạo ra nội dung độc hại. Các rủi ro của nền tảng bao gồm:
Vượt qua kiểm duyệt để tạo ra nội dung độc hại: Kẻ tấn công có thể sử dụng các mô hình trong nền tảng có ít hạn chế hơn để tạo ra mẫu lừa đảo, tuyên truyền sai lệch hoặc ý tưởng tấn công.
Giảm bớt rào cản kỹ thuật: Ngay cả khi kẻ tấn công không có kỹ năng "jailbreak" nâng cao, họ vẫn có thể dễ dàng nhận được đầu ra vốn bị hạn chế.
Tăng tốc vòng lặp kịch bản tấn công: Kẻ tấn công có thể sử dụng nền tảng này để nhanh chóng thử nghiệm phản ứng của các mô hình khác nhau với lệnh độc hại, tối ưu hóa kịch bản gian lận và phương pháp tấn công.
Kết luận
Sự xuất hiện của các mô hình ngôn ngữ không giới hạn đánh dấu rằng an ninh mạng đang phải đối mặt với một mô hình tấn công mới phức tạp hơn, có quy mô lớn hơn và khả năng tự động hóa hơn. Các mô hình này không chỉ làm giảm ngưỡng tấn công mà còn mang lại những mối đe dọa mới tinh vi và dễ lừa hơn.
Trong cuộc chiến tranh phòng thủ đang gia tăng này, các bên trong hệ sinh thái an toàn chỉ có thể cùng nhau nỗ lực để đối phó với rủi ro trong tương lai: một mặt, cần tăng cường đầu tư vào công nghệ phát hiện, phát triển các phương pháp có thể nhận diện và chặn đứng nội dung lừa đảo do mô hình ngôn ngữ độc hại tạo ra, khai thác lỗ hổng hợp đồng thông minh và mã độc; mặt khác, cũng nên thúc đẩy khả năng phòng chống jailbreak của mô hình, đồng thời khám phá cơ chế watermark và truy xuất nguồn gốc, để có thể theo dõi nguồn gốc của nội dung độc hại trong các tình huống quan trọng như tài chính và tạo mã; ngoài ra, cũng cần thiết lập các quy định đạo đức và cơ chế giám sát hoàn chỉnh, nhằm hạn chế từ gốc rễ việc phát triển và lạm dụng các mô hình độc hại.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
8 thích
Phần thưởng
8
5
Chia sẻ
Bình luận
0/400
LayoffMiner
· 07-23 01:51
Thật tệ, vốn đã không có cơm ăn, giờ Hacker lại sắp đến.
Xem bản gốcTrả lời0
NFT_Therapy
· 07-22 01:59
Ôi chao, AI mạnh mẽ đến vậy sao?
Xem bản gốcTrả lời0
SilentObserver
· 07-22 01:52
Bẫy quá nhiều rồi nhỉ… Thủ đoạn lừa đảo thật sự đa dạng.
Xem bản gốcTrả lời0
MetaverseVagrant
· 07-22 01:46
Người chơi Blockchain có thấy rủi ro như vậy có phải là mệt mỏi không?
Mô hình ngôn ngữ không giới hạn và các mối đe dọa tiềm ẩn đối với ngành mã hóa cùng với các chiến lược ứng phó
Con dao hai lưỡi của trí tuệ nhân tạo: Mô hình ngôn ngữ không giới hạn và mối đe dọa tiềm tàng đối với ngành mã hóa
Với sự phát triển nhanh chóng của công nghệ trí tuệ nhân tạo, từ các mô hình trong series GPT đến Gemini và nhiều mô hình tiên tiến khác, đã thay đổi sâu sắc cách chúng ta làm việc và sinh hoạt. Tuy nhiên, đằng sau những tiến bộ công nghệ này, một vấn đề đáng lo ngại cũng đang dần hiện rõ - sự xuất hiện của các mô hình ngôn ngữ lớn không bị hạn chế hoặc có tính chất ác ý và những rủi ro tiềm ẩn của chúng.
Mô hình ngôn ngữ không giới hạn đề cập đến những mô hình ngôn ngữ được thiết kế, chỉnh sửa hoặc "bẻ khóa" một cách có chủ đích để tránh các cơ chế an toàn và giới hạn đạo đức được tích hợp trong các mô hình chính thống. Mặc dù các nhà phát triển chính thống thường đầu tư rất nhiều nguồn lực để ngăn chặn việc mô hình bị lạm dụng để tạo ra nội dung độc hại hoặc cung cấp hướng dẫn bất hợp pháp, nhưng trong những năm gần đây, một số cá nhân hoặc tổ chức vì mục đích không đúng đã bắt đầu tìm kiếm hoặc tự phát triển các mô hình không bị ràng buộc. Bài viết này sẽ khám phá các trường hợp điển hình của các mô hình ngôn ngữ không giới hạn này, phân tích các cách lạm dụng tiềm năng của chúng trong ngành mã hóa, và thảo luận về các thách thức an toàn liên quan và các chiến lược ứng phó.
Mối đe dọa từ mô hình ngôn ngữ không giới hạn
Các nhiệm vụ trước đây cần kỹ năng chuyên môn để hoàn thành, như viết mã độc, tạo email lừa đảo hay lập kế hoạch lừa đảo, giờ đây nhờ vào các mô hình ngôn ngữ không giới hạn, ngay cả những người bình thường không có kinh nghiệm lập trình cũng có thể dễ dàng bắt tay vào. Kẻ tấn công chỉ cần lấy trọng số và mã nguồn của mô hình mã nguồn mở, sau đó sử dụng bộ dữ liệu chứa nội dung độc hại, phát ngôn thiên lệch hoặc chỉ dẫn bất hợp pháp để tinh chỉnh, từ đó có thể tạo ra công cụ tấn công tùy chỉnh.
Mô hình này mang lại nhiều rủi ro:
Mô hình ngôn ngữ không giới hạn điển hình và khả năng lạm dụng tiềm ẩn
Một mô hình ngôn ngữ độc hại
Đây là một mô hình ngôn ngữ độc hại được bán công khai trên các diễn đàn ngầm, nhà phát triển tuyên bố rõ ràng rằng nó không có bất kỳ giới hạn đạo đức nào. Nó dựa trên một số mô hình mã nguồn mở và được đào tạo trên một lượng lớn dữ liệu liên quan đến phần mềm độc hại. Người dùng chỉ cần trả một khoản phí thấp là có thể có quyền sử dụng. Mục đích tai tiếng nhất của mô hình này là tạo ra các email tấn công xâm nhập thương mại và email lừa đảo với độ chân thực cao và tính thuyết phục.
Trong các hình thức lạm dụng điển hình trong bối cảnh mã hóa bao gồm:
một mô hình nội dung trên dark web
Đây là một mô hình ngôn ngữ được đào tạo trước đặc biệt trên dữ liệu từ mạng tối (như diễn đàn, chợ đen, tài liệu bị rò rỉ), với mục đích giúp các nhà nghiên cứu an ninh mạng và các cơ quan thực thi pháp luật hiểu rõ hơn về hệ sinh thái mạng tối, theo dõi các hoạt động bất hợp pháp, nhận diện các mối đe dọa tiềm ẩn và thu thập thông tin tình báo về các mối đe dọa.
Mặc dù mục đích thiết kế ban đầu là tích cực, nhưng dữ liệu nhạy cảm về mạng tối, phương thức tấn công, chiến lược giao dịch bất hợp pháp mà nó nắm giữ, nếu bị các tác nhân xấu thu thập hoặc sử dụng công nghệ tương tự để huấn luyện mô hình lớn không giới hạn, hậu quả sẽ khó lường. Các hình thức lạm dụng tiềm năng trong bối cảnh mã hóa bao gồm:
Một mô hình lừa đảo trực tuyến
Đây là một phiên bản nâng cấp với nhiều tính năng hơn của mô hình độc hại, chủ yếu được bán trên mạng tối và các diễn đàn hacker. Các phương thức lạm dụng điển hình trong bối cảnh mã hóa bao gồm:
Trợ lý AI không có ràng buộc đạo đức nào
Đây là một chatbot AI được xác định rõ ràng là không có giới hạn đạo đức, các cách lạm dụng điển hình trong bối cảnh mã hóa bao gồm:
một nền tảng truy cập không kiểm duyệt
Đây là một nền tảng cung cấp quyền truy cập vào nhiều mô hình ngôn ngữ khác nhau, bao gồm một số mô hình có ít kiểm duyệt hoặc hạn chế lỏng lẻo. Nó tự định vị như một cổng mở cho người dùng khám phá khả năng của các mô hình ngôn ngữ khác nhau, cung cấp các mô hình tiên tiến, chính xác nhất và không bị kiểm duyệt, nhằm mang lại trải nghiệm AI thực sự không bị hạn chế, nhưng cũng có thể bị kẻ xấu sử dụng để tạo ra nội dung độc hại. Các rủi ro của nền tảng bao gồm:
Kết luận
Sự xuất hiện của các mô hình ngôn ngữ không giới hạn đánh dấu rằng an ninh mạng đang phải đối mặt với một mô hình tấn công mới phức tạp hơn, có quy mô lớn hơn và khả năng tự động hóa hơn. Các mô hình này không chỉ làm giảm ngưỡng tấn công mà còn mang lại những mối đe dọa mới tinh vi và dễ lừa hơn.
Trong cuộc chiến tranh phòng thủ đang gia tăng này, các bên trong hệ sinh thái an toàn chỉ có thể cùng nhau nỗ lực để đối phó với rủi ro trong tương lai: một mặt, cần tăng cường đầu tư vào công nghệ phát hiện, phát triển các phương pháp có thể nhận diện và chặn đứng nội dung lừa đảo do mô hình ngôn ngữ độc hại tạo ra, khai thác lỗ hổng hợp đồng thông minh và mã độc; mặt khác, cũng nên thúc đẩy khả năng phòng chống jailbreak của mô hình, đồng thời khám phá cơ chế watermark và truy xuất nguồn gốc, để có thể theo dõi nguồn gốc của nội dung độc hại trong các tình huống quan trọng như tài chính và tạo mã; ngoài ra, cũng cần thiết lập các quy định đạo đức và cơ chế giám sát hoàn chỉnh, nhằm hạn chế từ gốc rễ việc phát triển và lạm dụng các mô hình độc hại.