风险提示:理性看待区块链,提高风险意识!
OpenAI 再惹祸?个人信息合规成“锁喉”难题?
首页 > 业界 > 区块链 2024-02-20 11:44
摘要
上个月,意大利隐私监管机构Garante出具的调查结果认为,OpenAI公司存在一项或多项违反欧盟法规的行为,ChatGPT用于收集用户数据的技术已经违反了该国的隐私法 。
币界网报道:

来源:肖飒lawyer

上个月,意大利隐私监管机构Garante出具的调查结果认为,OpenAI公司存在一项或多项违反欧盟法规的行为,ChatGPT用于收集用户数据的技术已经违反了该国的隐私法。掀起生成式人工智能热潮的ChatGPT再次陷入数据合规风波。

数据和算力是生成式人工智能的核心。数据安全是生成式人工智能合规的核心问题,在人工智能对数据日益增长的依赖性的背后,生成式人工智能秘密收集数据,对“知情同意”原则和“最小必要”原则带来了严重挑战。与此同时,生成式人工智能在运行阶段包含着巨大的数据泄露风险。这对个人信息的保护带来了严重威胁。飒姐团队今日就谈谈生成式人工智能对个人信息安全带来的挑战与合规要求。

01 语料库数据的收集与使用

根据数据来源,大致可将涉个人信息的数据分为涉及个人信息的语料库数据以及涉个人信息数据的用户上传的数据。

生成式人工智能对数据具有高依赖性,需要大量的数据满足训练要求。这决定了,生成式人工智能往往会主动收集、处理公开和非公开的数据,预训练数据的规模通常可以达到数十亿甚至上百亿个参数量。若其中存在个人信息,根据《个人信息保护法》第27条的规定,“个人信息处理者可以在合理的范围内处理个人自行公开或者其他已经合法公开的个人信息;个人明确拒绝的除外。个人信息处理者处理已公开的个人信息,对个人权益有重大影响的,应当依照本法规定取得个人同意。”《生成式人工智能暂行管理办法》第7条也强调,“生成式人工智能服务提供者(以下称提供者)应当依法开展预训练、优化训练等训练数据处理活动,遵守以下规定:……(三)涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他情形。”然而,由于数据库数据规模过于庞大,逐一获得信息主体的同意这一要求难以实现。

既然获取信息主体的同意这一条路难以走通,那直接把数据库中的个人信息删掉可以吗?这也存在困难。一方面,当前缺乏行之有效的个人信息清洗算法,存在一定的技术悖论;另一方面,数据库规模之巨大导致人工清洗数据的成本极高,且存在个人信息二次泄露的风险。有研究指出,基于命名实体识别的数据清理技术,对临床健康数据的召回率为97%(姓名)和80%(护理单元编号)。换言之,在语料库、数据库中存在个人信息的情况下,在训练阶段,个人信息的清洗效果较差,科技公司存在合规风险。飒姐团队提醒,科技公司在使用语料库数据进行训练时,应当尽量选择不包含个人信息的数据集,同时尽可能提高识别算法的准确性,对识别的个人信息进行匿名或裁剪。在审核端采取机器过滤机制加人工审核机制,也是利大于弊的合规措施。

02 用户上传信息的收集与使用

用户上传数据可分为“用户积极投喂的数据”和“用户消极投喂的数据”。所谓用户积极投喂的数据,系指用户为获得生成式人工智能的反馈而上传的特定数据。所谓用户消极投喂的数据,系指用户为使用含生成式人工智能算法的应用程序或设备的其他功能而上传的数据。

生成式人工智能的运行通常需要用户主动“投喂”一定的数据,再基于算法进行分析、反馈。在这一过程中,人机交互数据将被加以记录、存储和分析,并可能成为模型算法更迭训练的数据。但在服务提供者未尽提示义务、用户缺乏安全意识等语境下,用户投喂的数据中很可能包含用户个人外貌、住址、联系方式等个人信息。生成式人工智能复杂的服务模式与多元的应用场景加剧了这一风险。随着数字技术的发展,用户的身份与其联系方式、人脸数据、指纹等深度绑定,而生成式人工智能常会收集到大量个人信息。例如,某AI公司的知名聊天机器人程序应用范围涵盖教学、科研、金融、传媒和娱乐等众多领域,用户与其进行的聊天记录中包含大量敏感信息,如个人身份、偏好、习惯等。这些数据若落入不法之手,将导致个人隐私遭到侵犯、身份盗用、金融欺诈等风险,对用户造成直接损害。

此外,生成式人工智能的使用场景广泛,常被嵌入各大应用程序乃至设备中。例如,今年1月,某浏览器已宣布引入3大生成式AI能力,某公司已推出全球首款搭载生成式人工智能技术的智能手机。即使未使用生成式人工智能技术,用户在使用相关应用程序乃至设备时,不可避免地会将产生、上传数据,而数据中很可能存在涉嫌个人信息的内容。

《生成式人工智能暂行管理办法》第十一条规定,“提供者对使用者的输入信息和使用记录应当依法履行保护义务,不得收集非必要个人信息,不得非法留存能够识别使用者身份的输入信息和使用记录,不得非法向他人提供使用者的输入信息和使用记录。提供者应当依法及时受理和处理个人关于查阅、复制、更正、补充、删除其个人信息等的请求。” 《个人信息保护法》《儿童个人信息网络保护规定》等法律法规对数据存储的期限制定了强制性规定。基于此,用户主动投喂的涉嫌个人信息的这类信息是否可以被服务提供者记录、存储以及存储的期限是有待商榷的。

同时,这类信息是否能被用于训练算法也存在一定争议。《生成式人工智能暂行管理办法》第7条强调,“生成式人工智能服务提供者(以下称提供者)应当依法开展预训练、优化训练等训练数据处理活动,遵守以下规定:……(三)涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他情形。”初次使用获得的用户授权不足以覆盖算法训练阶段数据使用的要求,科技企业必须有更明确的使用授权,或在符合法律法规的规定的其他情形的情况下,才能利用这类数据,否则可能会触犯民法、行政法甚至刑法的相关规定。但是,即使获得了用户的明确授权,生成式人工智能的运行阶段存在巨大的数据泄露风险,科技公司只有在确保数据的安全性的情况下,才可对涉个人信息数据加以利用。

为了提高生成质量,许多科技公司会想尽办法丰富数据保有量,提高数据聚集度。例如,某AI公司的《隐私政策》第2条标明,“我们可能会对个人信息进行汇总或去标识化处理,使其不再用于识别您的身份,并使用此类信息来分析我们服务的有效性、改进和添加我们服务的功能、进行研究和其他类似目的。”这是一种可行的方案,但是,根据“知情同意”原则,服务提供者承担告知义务,即服务提供者需将被收集的数据对象、数据用途和可能存在的风险等提前向信息主体说明,并在取得信息主体同意后才能实施收集行为。同时,科技公司应当为用户提供拒绝使用其个人信息的选项,而不应当将该条款变为僵硬的、强制性的通知条款。此外,根据“最小必要”原则,科技公司收集的涉个人信息应当采取与实现目标相关的、影响最小的方式,明确、具体地收集用户的个人信息。

03 写在最后

与传统人工智能相比,生成式人工智能往往有更强的信息收集主动性与更高的数据滥用风险。生成式人工智能需要持续地通过大规模的语料库、数据集来强化上下文理解能力,以不断升级和优化自身,在包括数据收集、数据存储、数据处理和数据生成的生成式人工智能运行各阶段内,不可避免地会涉及诸多个人信息、产生诸多法律与合规风险。而大数据时代个人信息的内涵与边界的模糊化、法律法规的滞后性与对技术成果的追求,也导致部分科技公司忽视了此类风险。飒姐团队提醒,合规是行业健康发展的前提与保障,追求成功的同时切勿对法律红线掉以轻心。

发表评论
发表评论
暂无评论
    相关阅读
    币界百科
    币界资讯
    微软公司首席执行官萨蒂亚·纳德拉表示,微软与 OpenAI 的重要合作关系正在发生变化。
    区块链
    2025-06-06 01:57:02
    OpenAI 发现其工具的秘密使用情况 [激增],特别是与出于恶意目的使用 ChatGPT 的中国团体有关。
    区块链
    2025-06-06 01:38:00
    无党派国会预算办公室警告,特朗普的税改计划将引发收入锐减3.67万亿,共和党内部分歧加剧!
    区块链
    2025-06-05 08:21:43
    加密资产成为业内人士首选资产传承工具,远超黄金、房产。
    比特币
    2025-06-04 13:31:31
    民主党人表示,美国证券交易委员会拒绝对加密法案进行分析,但却向共和党人提供了支持,导致党派冲突升级。
    区块链
    2025-06-04 06:10:23
    在加密货币交易领域,ALICE永续合约备受关注。永续合约作为一种特殊的衍生品,让交易者无需实际持有资产,就能对ALICE币的价格变动进行投机,且无到期日限制。而WIKEN交易所官网则是开启这场交易之旅的重要入口。想深入了解ALICE永续合约交易的门道吗?赶紧登录WIKEN交易所官网,DYOR,探索加密交易新可能!
    交易所百科
    2025-03-07 10:04:33
    近期莱特币市场表现活跃,出现日内大涨情况。据币界网最新行情晚报,LTC莱特币价格达126.57美元/枚,日内涨幅3.11%,交易量达20.57亿。从k线图分析,当前处于震荡趋势,相比11:00有较大幅上涨,且突破了12:00的高点。当价格和交易量同时上升,通常意味着市场买盘强劲,反映出乐观的市场情绪,价格可能继续上涨。依据威廉指标,当前市场未出现超买和超卖情况。不过投资者仍需关注关键阻力位的突破,同时注意设置止损点以应对可能的回调风险。市场变幻莫测,DYOR是每个投资者的必修课。
    区块链书籍
    2025-03-07 12:57:17
    在2025年,虚拟货币市场持续火热,众多交易app涌现。币安凭借庞大用户群、低廉交易费用和广泛加密货币选择稳居前列;Coinbase以用户友好界面和高安全性受青睐;火币网提供低手续费、高流动性和优质服务。此外,OKX、FTX等也各具特色,为投资者提供多样化选择。选择可靠的交易app,DYOR至关重要,以在虚拟币交易中获得更好体验。
    交易所百科
    2025-03-07 18:48:32
    2021年9月13日,一则沃尔玛支持莱特币线上付款的假消息在全球社交网络发酵,引发市场震动。受此利好影响,LTC瞬时暴涨超28%,带动比特币等加密货币集体上涨,投资者纷纷追涨。然而几分钟后,消息被证实为假,LTC瞬间暴跌,从大涨28%转向下跌1%,带崩整个市场。据bybt数据,新闻发布后一小时内,加密市场整体爆仓量超2亿美金。24小时内,莱特币爆仓2165.27万美元,加密货币市场爆仓人数超10万。这一事件凸显了加密货币市场的脆弱性和投资者面临的巨大风险。在缺乏实际价值支撑的情况下,一则未经考证的消息就能引发币价大幅波动,众多投资者因此遭受损失。此次事件也引发了对市场操纵和监管的关注,美国证券交易委员会或将加强对加密货币市场的监管,以保护投资者利益。
    区块链百科
    2025-03-08 09:44:32
    近期,加密货币市场因特朗普相关动态热度飙升。3月2日深夜特朗普提出XRP、SOL和ADA将被纳入美国加密货币储备,3月3日主流加密货币大幅上涨。而此前“特朗普币”曾被不法公司利用进行诈骗。如今特朗普将于3月7日主持白宫首届加密货币峰会,大家都在关注“特朗普币”今日最新币价会有怎样的表现。
    数字货币百科
    2025-03-07 21:23:57
    在比特币等加密货币的波动性极高的背景下,利用期货合约进行投资不仅能对冲风险,还能够在市场行情不利时实现盈利。本文旨在对目前市场上十大区块链交易所的期货合约功能进行详细对比,帮助您找到最适合自己的交易平台。如果您是期货合约的新手,或者希望优化您的投资策略,那么这篇文章将为您提供有价值的信息。
    交易所知识
    2025-04-08 17:57:03
    在某些主流交易所中,不少隐藏功能与高级玩法,却是90%的用户所未曾了解的。这些功能不仅可以帮助你提升投资收益,还能有效规避一些常见的风险。今天,本文将深度解析这些鲜为人知的功能,并提供实用的操作指南,确保每位读者都能在币圈中如鱼得水,高效交易。
    交易所知识
    2025-04-07 10:24:21
    在加密货币市场蓬勃发展的当下,WZRDs交易所官网与MAN交易所官网备受关注。WZRDs交易所有其独特的交易机制和服务模式,为众多投资者提供了数字资产的交易渠道。而MAN币依托的MAN交易所官网,其发行的MAN币基于以太坊ERC20标准,致力于为用户打造便捷、高效的数字货币交易体验。官网不仅能查看实时价格、交易数据等信息,还提供注册登录、交易、挖矿、钱包存储等功能。这两个交易所官网究竟谁更具优势,又分别适合哪些类型的投资者?本文将带你一探究竟,为你全面剖析这两个交易所官网的特点与差异,帮助你在加密货币的世
    交易所知识
    2025-03-03 21:17:39
    本文将深入解析十大区块链交易所的全球化布局。这些平台不仅提供了多种交易选项,还在不同国家和地区的覆盖情况各有千秋。我们将逐一对比它们的国家覆盖情况、提供的服务以及各自的优势,帮助你选择最合适的交易所,特别是值得关注的XBIT平台,它在全球的布局也十分引人瞩目。
    交易所知识
    2025-04-08 17:35:46
    在当今金融市场的浪潮中,CRO平台与ATOM杠杆成为了备受瞩目的焦点。CRO平台以其独特的运作模式和创新理念,在行业中崭露头角,其发展态势备受投资者关注。而ATOM杠杆作为一种具有高风险高收益特点的投资工具,也吸引了众多目光。本文将深入剖析CRO平台的发展现状、面临的挑战以及未来的发展趋势,同时对ATOM杠杆的原理、应用场景进行详细解读,帮助读者更好地了解这两个领域,为投资决策提供有价值的参考。无论是新手投资者还是经验丰富的专业人士,都能从本文中获取到有深度的信息和独到的见解。
    交易所知识
    2025-03-03 16:30:54
    推荐专栏
    Boss Wallet Web3 Econom Pass
    去中心化交易所
    一位相信价值投资的币圈KOL。稳定盈利的缠论野生交易员 #BTC行情分析师 #价值投资 #链上数据分析
    爱Web 3,爱生活,爱科技,爱炒币的老韭菜
    热门币种
    更多
    币种
    美元价格
    24H涨跌幅
    BTC比特币
    103,105.33 USDT
    ¥740,193.16
    -1.87%
    ETH以太坊
    2,577.05 USDT
    ¥18,760.92
    -2.006%
    USDT泰达币
    0.99990 USDT
    ¥7.18
    -0.04%
    XRP瑞波币
    2.16 USDT
    ¥15.51
    -2.88%
    BNB币安币
    650.94 USDT
    ¥4,738.84
    -2.548%
    SOL
    149.34 USDT
    ¥1,072.11
    -4.02%
    USDC
    0.99970 USDT
    ¥7.18
    +0.03%
    DOGE狗狗币
    0.17860 USDT
    ¥1.28
    -6.2%
    TRX波场币
    0.27320 USDT
    ¥1.96
    -0.04%
    ADA艾达币
    0.66100 USDT
    ¥4.75
    -2.31%
    热搜币种
    更多
    币种
    美元价格
    24H涨跌幅
    柚子
    0.6547 USDT
    ¥4.77
    +2.81%
    比特币
    103105.33 USDT
    ¥750,606.80
    -1.87%
    Livepeer Token
    8.2448 USDT
    ¥60.02
    -18.4%
    Mask Network
    2.9141 USDT
    ¥21.21
    +0.82%
    Horizen
    10.6823 USDT
    ¥77.77
    -5.07%
    Uniswap
    6.2041 USDT
    ¥45.17
    -2.4%
    Filecoin
    2.4815 USDT
    ¥18.07
    -5.13%
    PancakeSwap
    2.3617 USDT
    ¥17.19
    -2.53%
    币安币
    650.94 USDT
    ¥4,738.84
    -2.548%
    以太坊
    2,577.05 USDT
    ¥18,760.92
    -2.006%
    Solana
    149.34 USDT
    ¥1,087.20
    -4.02%
    Conflux
    0.074696 USDT
    ¥0.54
    -3.31%
    最新快讯
    更多
    外媒称世界自由联盟致函相关企业
    2025-06-06 03:46:00
    纳斯达克将专注于推出每周五天、每天24小时的交易模式
    2025-06-06 02:56:24
    特斯拉日内跌超11%
    2025-06-06 02:49:55
    特朗普:节省预算最简单方法是终止类似马斯克类公司的政府补贴和合同
    2025-06-06 02:44:14
    特朗普:马斯克彻底“疯了”省钱就该停他的政府补贴
    2025-06-06 02:43:38
    特朗普称应终止马斯克政府补贴以节省数十亿美元开支
    2025-06-06 02:41:29
    特朗普:马斯克「令我厌烦」,他发疯了
    2025-06-06 02:40:37