DeepSeek “通情達理”這樣煉成
看問題“更高一層”
當一個人感到困惑或焦慮時,和DeepSeek聊一聊,居然會有海闊天空的豁達感。
當你問它“戰勝焦慮有什么辦法嗎”,它的回答是:放棄“立刻變好”的期待,允許自己帶著焦慮生活,焦慮的消退像冰層融化,是悄無聲息的過程。
你問它“養育孩子的意義是什么”,它會告訴你:請接受生命最溫柔的“失敗”。育兒手冊里的標準答案并非萬能,沒有父母是完美的,總會遇到挫敗,而這些挫敗教會我們“愛不需要正確,只需要在場”。
還有人問它:一個人一生中沒有摯友,也沒有伴侶,能生活得開心嗎?DeepSeek的回答是:人類對幸福的定義,從來就不是單行道。當我們剝離社會規訓的濾鏡,會發現生命的豐盛程度,遠比傳統敘事里的標配人生更為遼闊。有人在與星辰對話中獲得靈魂共振,有人在古籍修復中觸摸千年體溫,更有人通過救助流浪動物構建情感網絡。
你和它探討“人生的意義是什么”,它認為:這不是一道填空題,而是一道論述題。它可能隨著時間、經歷而改變,少年時是夢想,中年時是責任,老年時是傳承。它還告訴你,答案并不重要,這個問題本身會推動我們不斷反思、連接他人,并在有限的生命里活得更清醒與熱烈。
AI的自我進化
一些人在和DeepSeek聊天后不禁發出感慨:AI越來越知曉人情世故,人類卻越活越像AI。DeepSeek的出現,改變了AI的哪些敘事邏輯?
不妨先從人工智能的發展主線說起。人工智能這一概念是在1956年達特茅斯學院研討會上正式提出的。從此,AI便踏上了一條機器自我學習的新路線,即處理數據、提取特征、訓練模型、改進性能、給出結果。
經歷了若干代更迭后,一種新的算法出現,即具有記憶和優化功能的循環(遞歸)神經網絡(簡稱為RNN)。可以把這種算法想象成一個有“記憶”的故事講述者,它會把當前情節的信息和自己之前“記住”的信息結合起來,去理解和處理一些新情節。
20世紀80年代,人工智能界又出現了一種反向傳播算法(簡稱BP算法)。想象一下,AI的BP算法就像是一個在迷宮中尋找出口的探險家,有了這種算法,探險家可以及時調整迷宮路線,讓自己下次走的時候更容易找到出口。
進入21世紀后,大語言模型(LLM)成為AI界研究的主流。大語言模型就像一個知識淵博且能力不斷突破的“超級大腦”——知識儲備豐富,語言理解能力強,語言生成能力出色,學習和適應能力強,等等。
DeepSeek等AI的大語言模型,依賴的是算法、算力和數據三大基本要素。三者之間的關系可以用烹飪菜肴來形象地說明。
算法就像烹飪的菜譜,規定了食材(也就是數據)如何被處理和組合。菜譜詳細介紹了每一步的操作步驟、調料用量以及烹飪的時間和火候等,就像算法規定了數據的處理流程、計算方法和邏輯順序。
算力則是廚師的烹飪水平和廚房設備的性能。一個技藝高超的廚師(強大的算力)能夠更快速、精準地按照菜譜的要求進行烹飪。同時,先進的廚房設備(高性能的計算硬件)也能幫助廚師更高效地完成烹飪任務。
數據就是烹飪所需的食材。沒有豐富多樣、高質量的食材,再精妙的菜譜和再厲害的廚師也無法做出令人滿意的菜肴。
將“頓悟”精準展示
餃子導演的哪吒系列動畫電影誕生了一句金句:“人心中的成見是一座大山”。DeepSeek以一己之力改變了AI領域的認知成見。
以前,AI領域普遍存在一種固化的技術認知,AI的大語言模型性能與算力投入呈正相關,他們強調“大力出奇跡”。而DeepSeek的出現直接證明了“算力不是唯一的標準”,算法創新也可以開出一條獨辟蹊徑的道路。
DeepSeek最讓人驚艷的是向大家展示了它的思考過程。就像人類在解決難題時,意識到之前的思路有問題,還會停下來重新思考。這是AI首次展現出像人類一樣的高階思維和內心獨白,這也是DeepSeek的獨特之處。
其實這種現象是機器的“頓悟”,只不過DeepSeek將它進行了更為精確的表達。
對于這種現象,中國科學院院士陳潤生曾這樣解釋:你訓練神經網絡的過程中,講一遍它不懂,兩遍也不懂,第四遍還不懂,第五遍一下學會了,就像小孩學東西一樣,教一兩遍不明白,教到N+1遍突然就學會了。
“頓悟”并不是DeepSeek最先發現的,OpenAI團隊在2023年就在大模型訓練時發現這一現象。但是,DeepSeek把這種頓悟寫進了公開的技術文檔里,并體現在應用的思考流程上,讓用戶看得到并且可以評判。
有趣的是,機器的這種領悟不是漸進式的,而是瞬間、突破性的,就像一個人在長期思考一個難題后,突然靈感乍現,恍然大悟。
更好地傳遞“衣缽”
隨著AI大模型的參數越來越多,應用端在處理某些領域問題時其實用不上如此龐大的模型。目前,各AI公司都在研究蒸餾模型,這是一種常用的技術方法。DeepSeek在做蒸餾模型時也進行了一些巧妙設計。
就像老師教學生知識,從易到難逐步深入,學生更容易接受。DeepSeek對一些大、小模型進行漸進式分層蒸餾,比如保留大部分架構特性,讓學生模型有個好基礎;提升推理速度,讓學生掌握快速解題的方法;優化決策路徑,提高任務準確率,這樣學生就能學會更高效的思考方式,能花更少的精力答對題。
蒸餾后的小模型,在推理能力上得到了顯著提升,甚至超越了這些小模型自我基礎上進行強化學習的效果。這一過程就好像是從一大杯濃郁的咖啡中提取出一小杯精華的濃縮咖啡,保留了咖啡的風味和香氣,也就是大模型的核心知識和能力。通過模型蒸餾技術,小模型可以在計算資源受限的設備上運行,如手機、智能手表等,實現快速推理。就好比學生繼承了老師的衣缽,最后獨當一面,解決各種問題。
許多人擔心,AI今后會取代人類。DeepSeek的回答是:AI不會取代人類,就像望遠鏡不會取代天文學家。真正的危機是:當AI可以24小時創作莎士比亞風格的十四行詩時,人類是否還愿意在深夜為愛人寫一首笨拙的情詩?
在AI這條賽道上,創造和堅持,或許才是人類最堅固的護城河。
標簽:
搶先讀
- DeepSeek “通情達理”這樣煉成
- 新華社旗下四大財經媒體看兩會·新興產業兩會新觀察|智能“進化”:機器人產業蓄勢待發
- 新華全媒+|中國下一代“人造太陽”關鍵系統驗收 達到國際先進水平
- DeepSeek “通情達理”這樣煉成
- 蹚出“中國式”人工智能發展之路
- 兩會看“新”|具身智能,前景幾何?
- 融合“粉色浪漫”與自然詩意 南京中山植物園早櫻盛放春色美
- 為大腦與脊髓搭建“新路” 我國科學家研發新技術助癱瘓病人恢復行走
- 哪吒周邊產品義烏銷售火爆 海外客戶慕名而來
- 為大腦與脊髓搭建“新路” 我國科學家研發新技術助癱瘓病人恢復行走
- 3月10日“農產品批發價格200指數”比上周五上升0.31個點
- 3月10日“農產品批發價格200指數”比上周五上升0.31個點
- 加拿大稱將繼續對美征收報復性關稅
- 帕杰羅的保養要點有哪些?帕杰羅油箱蓋開關位置在哪?
- 今年前2月廣西預計進資1.2億美元
- 凈值估算的依據是什么?凈值估算是負數什么意思?
- 寧夏民營企業累計獲簽逾1900份RCEP出口原產地證書
- 寧夏民營企業累計獲簽逾1900份RCEP出口原產地證書
- 泉州中心市區首個交通島遮陽棚啟用 將有效緩解市民候燈時受天氣困擾問題
- 青年消費,“性價比”走向“心價比”
- 中國最大南極磷蝦專業捕撈加工船啟航
- “民政通”率先完成原生鴻蒙適配 打造政務應用國產化轉型示范樣本
- 渝昆高鐵三觀樓隧道貫通 云南段隧道貫通已達70%
- 中新健康周報|政府工作報告首提“制定創新藥目錄”
- “民政通”率先完成原生鴻蒙適配 打造政務應用國產化轉型示范樣本
- 人民日報
- 人民日報
- 渝昆高鐵三觀樓隧道貫通 云南段隧道貫通已達70%
- 張克勤院士:建議加快植物保護法立法進程
- 銷量下降、股價下滑 特斯拉7000億可能要跌沒?
- 國家衛健委主任:正起草育兒補貼操作方案
- “LIV Golf 2025”職業高爾夫球巡回賽中國香港站揭幕
- 銷量下降、股價下滑 特斯拉7000億可能要跌沒?
- 極氪全尺寸SUV命名極氪9X,將于4月上海車展正式亮相
- 極氪全尺寸SUV命名極氪9X,將于4月上海車展正式亮相
- 單增海代表:建議推進工程機械二手車規范流轉
- 紀念孫中山逝世百年 馬英九倡兩岸合作振興中華
- 3月10日央行開展965億元7天期逆回購操作
- 1至2月全國鐵路發送旅客7.26億人次 同比增長4.7%
- 王江平建議:引導多主體開展高質量行業數據集建設
- 跟著電影游中國 去年橫店影視城外國游客量暴增近1000%
- 劍指“萬億級”!陜西高端裝備制造業強勢“出圈”
- 6G有多厲害?這些場景告訴你!
- 上海母港郵輪“海洋光譜”號單航次出境外籍旅客數超2600人 刷新紀錄
- 北京短道速滑世錦賽名單公布 孫龍、范可新領銜中國隊參賽
- 湖南冷水灘十萬余人齊趕社 擦亮農耕文化品牌
- 中國住建部:堅決穩住樓市
- 全國人大代表李東林:加快推動綠電制氫產業發展
- 全國人大代表耿福能:建議推動“AI+醫療”落地基層
- 基金的收益是怎么產生的?買基金可以隨時退出嗎?
- 北京大興機場口岸今年出入境人次破百萬
- 全國人大代表李東林:加快推動綠電制氫產業發展
- 全國人大代表李東林:加快推動綠電制氫產業發展
- 降碳減污擴綠,全面綠色轉型如何提速?
- 首店首展頻亮相 杭州成“首發經濟”新秀場
- 降碳減污擴綠,全面綠色轉型如何提速?
- 全國人大代表郭興田:優化“煥新”政策 釋放家裝市場潛能
- 住房城鄉建設部部長:建設、大力推廣“好房子”
- 股票短期頭部意味著什么?趨勢股一般能走多久?
- 凈值估算低的時候可以購進嗎?累計凈值高好還是低好?
- 你關心的身邊事,四位部長回應了
- 王啟榮代表:打造國家物流樞紐承載城市讓“物暢其流”
- 全國人大代表郭興田:優化“煥新”政策 釋放家裝市場潛能
- 為迎峰度夏能源保供夯基 瓦日鐵路展開春季集中修施工
- 王啟榮代表:打造國家物流樞紐承載城市讓“物暢其流”
- 王啟榮代表:打造國家物流樞紐承載城市讓“物暢其流”
- 股票當日委托交易沒有成功會如何?股票漲停可以買入嗎?
- 民生主題記者會丨住建部:將支持有條件的縣級市開展城市體檢
- 涉及就業、住房、養老……四位部長重磅發聲!
- 從“愿景”轉為“施工圖” 政府工作報告繪出了綠色經濟新藍圖
- 民生主題記者會丨住建部:住宅層高標準將調整為不低于3米
- 涉及就業、住房、養老……四位部長重磅發聲!
- 民生主題記者會丨民政部:讓老年人享受更好的“家門口”養老服務
- 民生主題記者會丨住建部:2000年以前建成的老舊小區納入城市更新改造范圍
- 股票定價和期貨定價的異同是什么?a股和個股有什么關系?
- 金融賦能徽派企業“抱團出海”
- 西班牙學者:美關稅政策將引發通脹 造成全球經濟不穩定
- 民生主題記者會丨住建部:2000年以前建成的老舊小區納入城市更新改造范圍
- 民生主題記者會丨民政部:通過“四個轉變” 有序推進民政民生保障向普惠性發展
- 西班牙學者:美關稅政策將引發通脹 造成全球經濟不穩定
- 民間資本迎來更大發展空間
- 海南自貿港加速建設國際旅游消費中心
- 傳統文化煥新 助力“哪吒”出海
- 2月中國CPI同比下降0.7% 春節錯月等因素影響
- 2月中國CPI同比下降0.7% 春節錯月等因素影響
- 重慶動物源性產品監管體系首次通過新加坡地區準入認證
- 2月中國CPI同比下降0.7% 春節錯月等因素影響
- 2月中國CPI同比下降0.7% 春節錯月等因素影響
- 月活過億App超七成接入AI
- 全球首個人形機器人“半馬”將在京舉辦
- “店播”開辟電商直播新增長路徑
- 月活過億App超七成接入AI
- 全球首個人形機器人“半馬”將在京舉辦
- “店播”開辟電商直播新增長路徑
- 當DeepSeek學會說“人話”
- 兩會觀察·數說中國經濟丨“3.6萬億元”折射科技創新力度
- 兩會速遞丨徐曉蘭委員:工業互聯網已實現工業大類全覆蓋
- 兩會速遞丨徐曉蘭委員:工業互聯網已實現工業大類全覆蓋
- 兩會現場速遞|“自動化的最后一個環節就等國產機器人實現了”——遼寧代表審議現場“催單”
- 療愈+悅己 合肥上新女性主題市集