微博账号被AI偷窥?官方回应:只抓取公开内容



文| 杨柳


近日许多用户发帖称,在微博“AI智搜”功能中输入用户名,AI会爬取公开内容甚至是仅好友可见的私密内容,输出一份类似于“用户画像”的分析总结。

随后,一些出于隐私担忧的微博网民,纷纷发布模板一致的拒绝授权书面声明,试图禁止微博平台将账号上的所有内容用于AI处理活动,包括机器学习、数据分析、自动生成摘要等。

这起事件引发的争议大致可分为两个维度:微博“AI智搜”是否爬取了用户非公开的帖子并整理输出?爬取所有人可见的微博内容,是否需获得用户的授权?


爬取了私密内容?

微博的“AI智搜”是一款内嵌于微博平台的AI搜索产品,今年2月接入DeepSeek-R1模型,拥有了深度思考能力。

根据用户的使用反馈,在“AI智搜”输入某位微博用户的昵称之后,AI将爬取其过往帖子,总结用户的内容风格、情感经历、价值观、兴趣爱好等等。

南都记者于4月22日的测试亦发现,搜索的部分账号的确出现了详细的AI分析内容,包括该账号的美食日常、追星动态、家庭与朋友、公益活动、社群动态、个人兴趣等,甚至提及该账号的地域关联,例如曾居住于香港、去过澳洲。但也有账号的搜索结果仅显示基本信息,例如微博简介、粉丝数量、是否认证等,没有详细分析账号历史博文内容。

一位微博用户发帖称,“AI智搜”把私密的微博内容也作为了分析总结的素材来源。

让不少用户不寒而栗的是,“AI智搜”甚至把私密的微博内容也作为了分析总结的素材来源。一位声称遇到相关情况的用户告诉南都记者,最初AI提供的分析总结中,引用了数十条非公开的微博发帖,不过,该问题目前似乎已被修复

《微博智搜使用须知》并未提到具体的内容爬取方式,但强调,发现微博智搜的生成内容存在引发争议、违反法律法规等情形时,将适时采取相关措施进行优化及调整。《微博智搜使用须知》是《微博使用服务协议》的组成部分。

“微博智搜”账号在4月22日曾公开回应称,微博智搜在产品开发之初就将用户隐私保护与数据安全列为首要原则,所收集和分析的数据一直局限于用户公开可见的内容,微博也不会通过智搜功能收集、存储或分析用户的非公开信息。

“微博智搜”账号在4月22日的公开回应。

4月24日,微博方面向南都记者再次表示,微博“AI智搜”的策略是默认抓取用户近一个月公开微博内容进行整理分析,而不会使用不公开的内容,“和搜索引擎的逻辑是一样的”

微博方面还表示,若用户对“AI智搜”功能有意见,公司会对产品予以调整

2月中旬,微信接入AI搜索时同样引起过隐私担忧。彼时,腾讯回应称,AI 搜索仅整合公众号及互联网其他公开信息,不会使用用户的个人信息和相关隐私信息。


拒绝授权声明有效吗?

如果仅爬取完全公开的微博内容,爬取的边界又如何划定?

按照个人信息保护法的要求,个人信息处理者可以在合理的范围内处理个人自行公开或者其他已经合法公开的个人信息;个人明确拒绝的除外。个人信息处理者处理已公开的个人信息,对个人权益有重大影响的,应当依照本法规定取得个人同意。

“AI智搜”隐私风波之后,大量微博用户发布拒绝授权声明,不允许微博平台使用该账号发布的所有内容,特别是人工智能相关的处理活动。


一位微博用户发布的拒绝授权声明。

实际上,这不是内容平台的网民第一次对AI处理个人数据的行为说不。南都记者去年12月注意到,一些小红书用户也发布所谓的“反向声明”,拒绝平台将用户上传的内容用于人工智能开发。

有待进一步明晰的问题在于,这类拒绝授权的单方声明,是否对平台产生法律效力?技术上,平台的算法又能否识别到声明所传递的含义?

大成律师事务所高级合伙人肖飒此前表示,这类声明直接明确了用户自己的拒绝态度,完全符合法律规定,并具有法律效力。但她担心,AI爬取时也许并不能识别这类声明——对于AI而言,该文章同样只是一份可供爬取的数据,与其他数据并无不同。

但一位算法研发工程师告诉南都记者,借助大语言模型分辨出这类拒绝授权声明并不困难,识别之后,只需在爬取系统中进一步设置业务逻辑即可

用户不得不公开声明的背后,是一些网络平台将用户个人数据用于AI处理,但未开设拒绝和退出的便利路径。“微博智搜”账号上述公开回应的留言区,有用户便表达了提供撤销功能的诉求。

国内外已有平台为用户行使拒绝权提供了渠道。在领英的个人账号设置页面上,用户可以自行控制是否将个人数据用于大模型训练和微调。今年3月,腾讯元宝增加数据管理功能,包含“体验优化计划”开关。除非用户主动开启这一开关,否则平台不会将用户上传和生成的内容用于模型优化。


南都记者陈袁对此文亦有贡献


(文:AI前哨站)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往