環球焦點!AI大模型數據被盜第一案?學而思和筆神作文“開撕”
6月13日,筆神作文發布“關于‘學而思’ AI大模型侵權事件的聲明”。聲明稱,4月13日至17日,學而思通過“爬蟲”技術非法訪問、緩存筆神作文APP服務器數據多達258萬次。嚴重侵犯了筆神作文APP的數據權益。
(資料圖)
對此,學而思官方微博發文回應稱:“首先,MathGPT是專注于數學領域的自研大模型,沒有任何作文相關數據;其次,‘作文AI助手’目前處于開發狀態,尚未發布,該服務并未使用筆神作文的任何數據?!?/p>
6月14日,筆神作文再度發文,在這篇題為《學而思,你做了一次標準的扒庫示范》的聲明中,其表示“我們認為學而思方所述并非事實”,并列出了相關證據。
受訪專家向記者分析,本次風波的實質是授權合同違約糾紛,涉及到對于合同授權范圍條款的解釋。AIGC產品獲得訓練模型數據授權是合規的根基。
學而思AI大模型疑盜取合作商數據?
“學而思在今年4月13日至4月17日,通過‘爬蟲’技術非法訪問、緩存筆神作文APP服務器數據多達258萬次?!惫P神作文在6月13日聲明中表示。
筆神作文認為,這一行為不僅違反了雙方的合同條款,也違反了《數據安全法》相關規定,嚴重侵犯了筆神作文APP的數據權益。事后其曾向學而思方面進行取證,并且對方承認是他們的算法組在爬取數據并作為己用,但在收到律師函后始終沒有實質性答復。
記者了解到,筆神作文是隸屬于北京一筆兩劃科技有限公司的品牌,據其官網介紹,筆神是一款人工智能輔助寫作軟件,擁有千萬級寫作素材庫。筆神作文與學而思之間有著多年的合作基礎。
筆神作文稱,在不到一個月的時間,學而思的AI大模型MathGPT里包含的新產品“作文AI助手”就即將上線。疑似指后者作文AI產品使用了其數據。
筆神作文還表示會通過法律途徑來維護自身權益,但目前國內并沒有“AI大模型數據盜取”的判決先例。“希望學而思就此支付1元賠償金,并公開道歉,同時刪除已爬取的數據?!?/p>
各執一詞:正常合作還是“扒庫”行為?
6月13日晚,學而思發布聲明,從三方面進行回應:
一是,學而思和筆神作文于2020年12月開始合作,合作協議明確約定:筆神作文為學而思提供“筆神作文范文素材服務接口”,用于學而思相關服務中,每月保底費用包含的調用次數為百萬次量級。合作至今,雙方一直按照調用量進行正常結算。
二是,學而思對筆神作文接口的調用,屬于雙方合同約定的正常合作范圍,對筆神素材內容的使用均符合合同要求,并未用于合同以外的任何用途。
三是,筆神作文在公開聲明中提及學而思正在研發的數學大模型MathGPT以及學而思學習機“作文AI助手”,并主觀揣測學而思使用其數據用于兩款產品的訓練和研發,這與事實嚴重不符。
“首先,MathGPT是專注于數學領域的自研大模型,沒有任何作文相關數據;其次,作文AI助手目前處于開發狀態,尚未發布,該服務并未使用筆神作文的任何數據。”學而思稱。
6月14日,筆神作文發布《學而思,你做了一次標準的扒庫示范》,表示“我們認為學而思方所述并非事實”,并列出相關證據。
筆神作文稱,學而思在聲明里提到調用數據為正常使用,筆神作文在合同中明確“甲方(注:三體云聯公司)不得隨意泄露、使用、傳播或緩存乙方(注:一筆兩劃公司)服務接口中的作文范本及相關內容,否則造成的損失將由甲方全額賠償”。同時,在合同中提出“甲方不得在未經乙方允許的情況下用于任何其他用途,包括緩存,存儲,作為語料進行計算,訓練等?!?/p>
但在2023年4月13日至4月17日之間,筆神作文檢測到服務器接口出現大量有規律的異常訪問,導致服務器承載壓力快速升高。通過查閱服務器日志發現:三體云聯公司未經一筆兩劃公司授權許可,用單一IP通過“爬蟲”技術非法訪問一筆兩劃公司服務器數據多達 258 萬次。
(圖源:筆神作文APP微信公眾號)
“而且,從這個IP的訪問日志來看,每次訪問的搜索詞都是作文相關的高頻搜索詞,我們每頁會返回30篇作文,每次訪問都是用搜索詞從第一頁逐頁向后翻,這種方式基本上把庫里同個題目的所有作文全部抓取完了,這種行為不是正常人使用的方式。而且很多訪問的間隔都是100毫秒左右,也不可能是正常人訪問的速度。”筆神作文表示。
(圖源:筆神作文APP微信公眾號)
筆神作文認為,這種對數據庫的搜刮式訪問,與以往正常的訪問方式完全不同,按業內的通常說法,這就是一種典型的“扒庫”行為。
網絡安全專家陳業炫告訴記者,所謂“扒庫”是一個口語化的形容詞,用于形容大規模爬取數據?!皵祿老x過程中,爬取的規模大了、頻率高了,就會被認為是非正常行為。通常情況下,高頻率的請求,大規模、每一篇都會訪問的遍歷式行為都需引起關注。”
據陳業炫介紹,爬蟲本身就是程序化的自動行為,比如每秒10次的訪問量可以看作是超出普通用戶的行為頻率,正常用戶不會大規模、高頻率的訪問相關網頁。
在這個事件中,哪些行為是被允許的?哪些是不被允許的?“筆神允許相關合作方查詢、查看數據,但是不能本地化存儲用于機器學習的素材?!标悩I炫說。
據筆神作文介紹,基于雙方的合作精神,筆神作文自己的技術團隊設計了完備的安全機制,正常情況下,可以防止黑客們進行爬蟲攻擊。而只有提供給合作伙伴學而思的接口是不設防的。
如何理解接口不設防?陳業炫介紹,筆神作文方面未對學而思設置反爬蟲措施?!叭粘5暮献髦校_放數據的一方通常需要限制訪問的行為,包括頻率和總量,給自己留以一定的反應時間,以防全部數據被快速抓走?!?/p>
記者多次通過官方電話嘗試聯系事件雙方,截至發稿前未得到回復。
AIGC伴生侵權風險 獲得數據授權是關鍵
AIGC火爆出圈,與之伴生的侵權風險問題也引發各界關注。國家網信辦今年4月發布的《生成式人工智能服務管理辦法(征求意見稿)》提到,提供者應當對生成式人工智能產品的預訓練數據、優化訓練數據來源的合法性負責。用于生成式人工智能產品的預訓練、優化訓練數據不得含有侵犯知識產權的內容。
中倫律師事務所合伙人王飛指出,以ChatGPT為代表的生成式AI,底層是一款通用的自然語言生成模型,通過互聯網海量的語料庫訓練,對語言文本進行概率建模來預測下一段輸出內容的概率,從而實現根據用戶輸入的文字內容生成對應文字回答的功能。
具體到本次學而思和筆神作文的“AI大模型數據竊取”風波,王飛表示,這個事件實質是授權合同違約糾紛,涉及到對于合同授權范圍條款的解釋。AIGC產品獲得訓練模型數據授權是合規的根基,授權的內容和范圍、使用的形式等一般會在簽訂授權合同時予以明晰,但鑒于AIGC作為新生產物,怎樣進行約定還要再進行探索,也會是未來AIGC產品糾紛產生的主要原因之一。
陜西華格律師事務所律師葛偉超也認為,這主要是基于合同目的而產生的問題?!半p方可能會因為合同中關于數據使用的范圍、方式、程度等條款約定不明產生不同理解,而對簿公堂?!?/p>
那么,構成AI大模型“數據盜取”行為,有哪些主要的判斷因素?
“AI數據抓取案件本質上與近年來司法判決的典型數據抓取案件并無差別,都需要判斷抓取數據行為是否損害數據持有者的商業利益與市場競爭優勢、是否屬于未經許可使用他人勞動成果、是否違背商業道德、抓取數據是否有合理理由?!蓖躏w說。
在法律責任方面,葛偉超指出,利用抓取技術破壞他人市場競爭優勢,具有并存在為自己謀取競爭優勢的主觀故意,違反誠實信用原則,擾亂競爭秩序的數據抓取行為,可能構成不正當競爭行為。同時也直接違反了《數據安全法》相關規定。
“如果合作協議中有約定違約責任條款,則依其處理。如果沒有約定該種情形,則屬于侵權范圍,要承擔相應侵權責任,包括但不限于賠禮道歉、停止侵權、賠償損失等。”葛偉超說。
大模型的開發離不開海量數據(603138)助力。當前,數據來源的知識產權已經成為大模型發展的阿喀琉斯之踵。AI模型開發主體以何種方式、需要承擔何種程度的法律義務以獲取訓練數據,是當前產業需要解決的核心問題。
值得關注的是,傳統的“授權許可模式”對于大模型的數據訓練存在天然困境,不僅在于實操層面難以落地,更在于對產業研發的長期影響。業界有觀點認為,可以將數據納入合理使用的范疇進行規制。
目前來看,日本、英國、歐盟等已對將數據挖掘作為合理使用的情形進行了立法確認:日本以“計算機信息分析”的名義規定了文本數據挖掘的著作權例外,英國同樣引入文本和數據挖掘的版權許可或例外情況,歐盟則選擇“非科研目的”例外的謹慎方案。中國業內也在探討是否可以通過數據的合理使用解決數據權屬帶來的問題。
對于如何厘清數據合理使用和保護的邊界,葛偉超認為,“首先,要明確擁有數據的經營者權利,即擁有數據所有權還是數據用益權。其次,明確數據抓取行為的性質。再次,明確該種行為損害的法益是數據財產還是競爭優勢。最后,需要明確規制該種行為到底適用于競爭法、民法、或者著作權法的保護?!?/p>
標簽:
搶先讀
- 聚焦“天府菜油”丨另辟蹊徑 中豪糧油開辟黃菜籽油全新賽道 快訊
- 外媒:英特爾將從德國政府獲得近110億美元的補貼 世界觀點
- 暗訪|誰“偷”了我的信息:星巴克掃碼點餐時3次彈窗加會員,“Wagas”霸王要位置
- 環球熱消息:國企招聘應屆畢業生有80后?回應來了
- 聚焦服務高成長創新型企業 2023年創業軍機處啟動
- amd確認mi300xgputbp為750w|天天播資訊
- 全球速訊:商務部部長助理陳春江會見嘉吉公司全球總裁兼首席執行官尚博遠
- COSMO態度:流行下去,才是傳統
- 杭州最新規劃了42處郊野公園 來看看分布在哪些地方?
- 每日聚焦:DraftKings(DKNG.US)出價1.95億美元收購PointsBet美國業務 較Fanatics報價高30%
- 每日報道:23068期大樂透曬票,無論跌了多少次,你都要堅強地再次站起來
- 第十五屆海峽論壇準備就緒 邀請臺灣嘉賓5000余人
- 寶駿云朵續航曝光:2款車型 續航360/460km_世界快訊
- 全球今頭條!伊朗媒體:美國打造“亞洲版北約”是場危險游戲 注定以失敗收場
- ?我省首批城市公園綠地開放共享清單 225個公園可供休閑游憩
- 【天天速看料】肌底液可以天天用嗎 ?使用要規律
- 寧夏固原警方打掉一集資詐騙犯罪團伙 涉案資金1.8億余元
- 小小說短篇小說_小小說作家網_當前關注
- 微資訊!DIGITIMES Research:印度電信行業將在2023年快速部署5G
- 中國人壽海外公司獲批注冊資本變更為110.56億元|天天播報
- 中國香港老戲骨張英才去世:曾出演張衛健版《西游記》|每日資訊
- 2023小米徠卡影像大賽特展開幕,小米攜手周云蓬用影像講述心里的故事 世界看熱訊
- 直擊梅西中國行,快手上線獨家專訪,60分鐘累計觀看人數達1.5億
- 6月16日華泰柏瑞匠心臻選混合A凈值上漲1.29%
- 6月18日起,勝利西街清平路交叉口將半封閉施工
- 微動態丨警方通報“球迷沖場擁抱梅西”:邸某某,18歲,行拘
- 6月16日中石化西布爾丁腈橡膠價格下調 每日信息
- 東方精工:嘉騰機器人是國內領先的AGV及智能物料配送解決方案提供商
- 深圳寶安新橋街道:筑牢全社會安全生產防線保障高質量發展
- 五部門:加強種業振興等農業關鍵核心技術攻關金融支撐|速讀
- 保護千年古城 安徽黟縣向全球聘賢
- 【世界播資訊】助力汽車產業高質量發展 第十四屆山東汽博會開幕
- 焦點!發布千億投資機會 成都未來公園社區滬上“吸金”
- 全球快消息!莎莎國際2023財年實現扭虧為盈 內地版圖正加速縮減
- 環球微速訊:《封神第一部》《超能一家人》等80余部影片鏖戰暑期檔!
- 英德市氣象臺發布暴雨黃色預警【III級/較重】【2023-06-16】
- 復星醫藥(02196):注射用拉氧頭孢鈉獲藥品注冊批準_熱消息
- 贛鋒鋰業:終止與PMI代加工合作協議
- 環球視訊?。ǔ啥即筮\紀事)成都大運會5個項目53個場次門票首批開售
- 快看點丨什么水果維生素C含量高 維生素c含量最高的十種水果
- 德固特(300950.SZ)股東上海青望及魏鋒合計減持225萬股 減持數量過半|天天資訊
- 環球視點!注意!下周要調倉換股了!
- 剛剛,“中特估”狂飆!更大行情已開始? 世界微速訊
- 當前滾動:河南省澠池縣發布大風藍色預警
- 自媒體:梅西今晚啟程去羅薩里奧,預計參加里克爾梅的退役賽_全球即時
- 全球熱文:嬰幼兒奶粉板塊股票有哪些?嬰幼兒奶粉板塊股票一覽
- 【天天報資訊】房企“門外漢”逆勢入場,房地產市場格局迎來深度調整?
- 江門深入推進專項整治標本兼治 大力加強執法隊伍建設-快資訊
- 鼎信通訊:預中標4億元電網采購項目 環球快報
- 獨家對話天文學家鄧李才:在冷湖仰望星空 打造國際最好的天文臺-每日消息
- 我國首艘海陸一體化生產運營的智能FPSO“海洋石油123”交付
- 今亮點!生態環境部:從未授權“生態環境導向的開發(EOD)模式”項目相關活動
- 前沿資訊!巨星待遇!孫興慜替補待命,記者紛紛將相機對準替補席的韓國天王
- 世界觀點:每日優鮮再被執行215萬,未履行總金額2396萬余元
- 慈利:釋青春活力 展運動風采 環球快訊
- 環球簡訊:中國科學家發現沙漠變土壤“密碼”
- 焦點熱門:發言人來了|個個會應急!江北區11人獲評“最美應急人”
- SHEIN產品環保問題惹爭議,在法國發展受阻
- 形容大樹生長茂盛的詞語_形容大樹生長的詞語 環球熱點評
- 一圖讀懂“亮劍浦江”上海個人信息保護專項行動:為期半年,“劍”指八大消費場景-前沿資訊
- 世界看熱訊:埃曼紐爾施_埃曼紐爾 施
- 北向資金今日大幅凈買入105.46億元
- 天天視點!莫桑比克主要反對黨最后一座軍事基地關閉
- 仰望登臨粵港澳大灣區車展,仰望U8、U9成展會焦點|簡訊
- 天天新動態:試車日志 | 凱迪拉克GT4:面子和里子我都要
- 用戶故事 | 思看科技 X 東芝水電:協同創新,聚力能源數字化未來
- 世界銀行新行長彭安杰:中國不是競爭對手 全球熱頭條
- 伊朗媒體:美國打造“亞洲版北約”是場危險游戲 注定以失敗收場
- 河北藁城:強筋麥成為農民的“增收麥”
- ?花都區打造全省唯一“互聯網+”現代農業產業園 當前資訊
- 全新首發!40年前考古鏡頭記錄了什么?|全球熱資訊
- 世界熱點評!4層以上住戶留意了,新規下,高層住宅將消失?這“3類人”將受益
- “長沙GDP被鄭州反超?”——綜合因素分析 觀天下
- 今頭條!國家發改委:統調電廠存煤達歷史新高 迎峰度夏電力保供基礎堅實
- 鄭堯:愛學習的媽媽
- 動力參數亮眼/調校有待提升 凱翼昆侖500試駕體驗
- 呼和浩特:校園足球聯賽點燃夏日激情 世界信息
- 心意之禮 致敬父愛 尼康誠意佳作獻禮父親節 天天觀速訊
- 【世界聚看點】許金泉獲批擔任富邦財險董事長
- 每日簡訊:通信設備板塊漲2.91% 光庫科技漲20%居首
- 瀚鎧RX 7900 XT次旗艦顯卡 直降1320元! 世界熱聞
- 每日熱點:國產開放世界游戲《仙劍世界》開啟預載,推薦 RTX 3060 顯卡
- “法律援助進校園”活動走進西安高新第二小學 全球微動態
- 櫥柜專家融合技藝創新 海南磚體櫥柜引領行業潮流
- 央企入局,中海抄底摘得紫蘭苑地塊 世界信息
- 焦點快播:東吳證券:二季度相對明確的基本面拐點確立 建議重視保險板塊回調帶來的布局機會
- 每日焦點!南嶺民爆:子公司中標工程項目 中標金額47億元
- 【全球時快訊】大通縣氣象臺發布雷電黃色預警信號【2023-06-16】
- 克宮:不打算提前終止糧食協議
- 快手616全民商品講解任務操作指南是什么?附攻略-世界速讀
- 環球速看:物業應履行安全管理職責!武漢一市場監管所組織開展電梯安全宣傳及應急演練活動
- 1-5月,全省規模以上工業增加值同比增長2.9%_即時看
- 熱推薦:英國將向烏克蘭提供6000萬英鎊援助
- 星紀魅族集團董事長沈子瑜、京東集團副總裁吳雙喜齊聚生日會 共慶京東魅族 20 周年
- 福元醫藥:公司獲得化學原料藥利多卡因上市申請批準通知書-今日報
- 上海銀行同業公會發自律公約:不應以利率為單一手段爭攬客戶
- 環球熱頭條丨全球首個干細胞合成人類胚胎模型,會引發倫理危機嗎?
- 共建世界旅游目的地|美宿貴州③:懸崖酒店觀奇景 當前快報
- 華菱線纜:控股股東變為湘潭鋼鐵集團有限公司
- ?北京中考倒計時!提醒各位考生,這些事項要注意_熱點聚焦