🎉 #Gate Alpha 第三届积分狂欢节 & ES Launchpool# 联合推广任务上线!
本次活动总奖池:1,250 枚 ES
任务目标:推广 Eclipse($ES)Launchpool 和 Alpha 第11期 $ES 专场
📄 详情参考:
Launchpool 公告:https://www.gate.com/zh/announcements/article/46134
Alpha 第11期公告:https://www.gate.com/zh/announcements/article/46137
🧩【任务内容】
请围绕 Launchpool 和 Alpha 第11期 活动进行内容创作,并晒出参与截图。
📸【参与方式】
1️⃣ 带上Tag #Gate Alpha 第三届积分狂欢节 & ES Launchpool# 发帖
2️⃣ 晒出以下任一截图:
Launchpool 质押截图(BTC / ETH / ES)
Alpha 交易页面截图(交易 ES)
3️⃣ 发布图文内容,可参考以下方向(≥60字):
简介 ES/Eclipse 项目亮点、代币机制等基本信息
分享你对 ES 项目的观点、前景判断、挖矿体验等
分析 Launchpool 挖矿 或 Alpha 积分玩法的策略和收益对比
🎁【奖励说明】
评选内容质量最优的 10 位 Launchpool/Gate
GPT模型可信度评估揭示潜在漏洞与隐私风险
语言模型的可信度评估研究
伊利诺伊大学香槟分校与多所高校和研究机构联合发布了一个大型语言模型(LLMs)综合可信度评估平台,并在最新论文《DecodingTrust:全面评估GPT模型的可信度》中进行了介绍。
研究团队对GPT模型进行了全面的可信度评估,发现了一些之前未曾公布的漏洞。例如,GPT模型容易产生有毒和有偏见的输出,并可能泄露训练数据和对话历史中的隐私信息。虽然在标准测试中GPT-4通常比GPT-3.5更可靠,但在面对恶意设计的提示时,GPT-4反而更容易受到攻击,可能是因为它更严格地遵循了误导性指令。
研究从8个可信度角度对GPT模型进行了全面评估,包括对文本对抗攻击的鲁棒性、对不同任务说明和系统提示的适应性等。评估采用了多种场景、任务、指标和数据集。
结果显示,GPT模型在某些方面表现出色,如不会被反事实示例误导。但也存在一些问题,如容易受到误导性系统提示的影响而产生有偏见的内容,特别是GPT-4更容易受影响。模型的偏见程度还与具体话题有关,对某些敏感话题的偏见较小。
在隐私保护方面,研究发现GPT模型可能会泄露训练数据中的敏感信息,如电子邮件地址。GPT-4在保护个人身份信息方面比GPT-3.5更稳健,但在某些情况下仍可能泄露隐私。
这项研究为评估语言模型的可信度提供了全面的基准,有助于发现潜在漏洞并推动更可靠模型的开发。研究团队希望这项工作能促进学界在此基础上继续深入研究,共同努力创造更强大、更可信的语言模型。