Showing posts with label 科技發展. Show all posts
Showing posts with label 科技發展. Show all posts

Wednesday, January 21, 2026

AI帶來「認知債務」

最近,MIT學者寫了一篇論文,有關利用AI寫作與大腦思維的關係。( 相關連結 ) 他們提出了一個新的名詞,叫認知債務 ( cognitive debt)。

-----------------------------------------------------------------

MIT的研究人員用腦波掃描發現,當我們只靠自己去完成寫作,我們的大腦皮層高度活躍,負責創造、整合、監控等多種高級功能的區域都在協同工作。一旦我們開始用AI輔助,這些區域的活動量就顯著下降,大腦進入了一種低投入的狀態。

研究者請三組不同人去做一個實驗: 第一組用AI寫作;第二組用搜尋引擎幫助;第三組只靠自己寫作。寫完後,讓他們複述自己文章裡的內容

結果顯示:用AI的那組,百分之八十的人連一句完整的話都複述不出來,百分之百的人無法完美複述。而只靠自己的那組,只有百分之十一的人有困難。

----------------------------------------------------------------------------

寫作這個過程毫不簡單,需要人腦多功能的協調才能完成這類任務,特別是一篇長文,所需的大腦功能更多。寫作要求的能力如:組織文章結構、建構文章組織的邏輯順序、或腦內找尋詞語和造句等等,這些能力協調必須日積月累,從小持續的訓練。完全依賴AI的話,長期下去,我們把本該由自己完成的思考過程讓給AI。

持續依賴人工智能而不是自己去寫作,我們大腦中負責深度思考的能力,沒有得到足夠的練習。長久下去,無論如何大腦的功能都會受到影響,這是我個人的看法。

很多人對現在坊間流行的LLM底層邏輯完全不了解,它所謂的思考,其實是利用統計學去了解大數據,從而去造出預測。粗略去說,AI本質上是一個機率機器,它永遠會給你最常見、最平均、最安全的答案。長期依賴AI,思想和表達會變得格式化,向最平凡,最普遍的方向走,失去了一丁點的人性化。

如多用人工智能,便發現其擅長的長文分析,表面上全面而且很有理性與邏輯,但其實沒有一點點人性化的東西。未來AI普及後,肯定是更有人性化空間的東西或工作變得更稀缺,也更有價值,不涉及人性的東西或工種,會全給AI搞定。

在這個Blog,所有Blog文都是自己寫作,數年前已說過,寫作這過程可給我空間去訓練大腦與中文寫作能力,另外,也把這Blog當成多年來在生活與投資上的個人記錄。直至現在,從未有用過AI去修改任何文章

用AI的話,沒錯,可減少文法上的錯誤,避免錯別字,或直接提高寫文的效率,但這Blog沒商業性質,效率這二字對我而言沒什麼意義。如我真的想多人看這Blog,或宣傳什麼,其實完全沒必要定期(過去數年基本上是一個月兩篇或三篇,從不間斷)寫長文,現在這年代沒人會多花時間在長文,只會花時間在短文 / 短留言 / 短視頻等地方。

我沒說過所有人都應避免AI,事實上在不少行業中,大語言模型已見其效用,特別是需要寫code的人,相信已離不開AI的幫助,效率提升太大了。我自己比較常用AI的地方主要把它當成強化版search engine,工作上一些繁瑣的機械化程序 (如做powerpoint開會),也交給AI去提高效率。最近也多用AI去分析或了解不同股票,但當然,最後投資決定完全掌握在我的腦中。

善用AI提升工作或生活上的效率 ; 同時間,避免對AI產生必要的依賴,也同時堅守我個人的價值:強調大腦不停訓練與深度個人思考的重要性。這兩者需要一個很微妙的平衡。

Wednesday, February 5, 2025

談DeepSeek

近兩周,DeepSeek成為全球討論熱話。整個大模型open source,deepseek同時間公開發報一篇論文,提到模型算法內的技巧枝節。

對於寫代碼或編程,我的了解有限。對於跟數學原理有關的算法,我還算略知一二。下載他們發表的論文一看,部分粗略看懂。結合美國AI大廠工程師的解釋,大概明白多一點。

在訓練模型流程的細節位,極端優化算力與存儲能力的運用。例如整個運算到達某一個階段時,模型會自動砌割成數個細分小模型,各模型處理的參數與擅長的數據範圍不同,從而減少消耗無謂的算力。在運算方面,模型學習過程涉及大量大型矩陣乘法,技巧地活用不少線性代數原理,把巨型矩陣分解成不同因子,各因子是體型更小的矩陣,乘法運算上節省不少時間與存儲空間。其他的細節特別是有關RL的,我便不懂了。

若不是高端芯片短缺的話,正常思維路徑的模型建設者不會去考慮相關的技巧優化細節。只能說是高端芯片受限這個大環境下,才會去建構這種大模型。美國大量頂尖工程師不是能力不足,而是在優越大環境下,硬件軟件絲毫不缺,養尊處優,當然不會想盡辦法做出極端優化。

再次印證necessity is the mother of innovation。

在算力成本大大縮減的狀況下,模型性能卻不比美國頂尖的大模型差,這是第一個關鍵。第二個關鍵是整個模型開源,則全球的軟件工程師都可在這模型上進行更細緻的優化,更新或改進,或直接從中開發中更有應用性的產品。

在發展AI進程中的突破性進展,少不免有質疑聲音與造假的說法。整個模型open source,美國各大廠的工程師已細閱當中細節,基本上可看成第三方權威評估,各大廠(Dell, Amazon, Microsoft, etc...)已把deepseek模型陸續上線在自己的平台,造假可能性很低。其次,已有小規模的AI團隊如美國UC Berkeley博士生,利用deepseek上傳的模型編碼,自行建構自己的模型,發現模型確實可節省大量成本,但性能依然超卓。

當中最不透明的地方大概是deepseek需要的芯片量與種類,有陰謀論說它用了大量違規得到的英偉達最高階GPU芯片進行開發,這可能性當然不能排除。但deepseek模型當中的原創性想法得到業界AI工程師核實,它著實節省大量成本。即使不是坊間所說的50-100倍,節省成本是至少10倍,這是現階段業界人士的理解。

至於Open AI早陣子的指控,指deepseek團隊運用蒸餾法,把Open AI得出的數據蒸餾製作出自身模型,更是令人啼笑皆非。數據蒸餾法是業界常用的手法,Open AI的AI團隊不可能不知吧 ? 利用一個AI的數據或訓練結果去訓練另一個AI,已是很普遍的做法。

至於Open AI指控的所謂侵權行為更是可笑,Open AI的模型不是開源,根本不能抄襲或參考。其次,Open AI製造出的LLM本身是建基於偷竊全球數十億網民發報的資訊。如媒體在網上公開的文章全都有版權,內容創作者在不同平台發出的資訊全都有版權,Open AI私自運用這些海量數據製作LLM模型,過程中完全不開源,營收源自用家的月費,引入大量投資者投資而自肥,企圖狀大自己至龐然大物壟斷市場。若Open AI完全守法守規,所有網上資源都先申請得到創作者或機構同意才運用,成本增加萬億元也不止,Chatgpt誕生前公司已破產。

美國數個科技巨頭近年大量投資AI項目,搞軍備競賽,築高牆,營造一個必須年花數百億美元才有條件搞AI的大氛圍,不讓中小企或個人設計開發者有突出重圍的機會(即使他們有力突圍,也需要向巨頭們大量付費,利用巨頭的數據中心,數據或雲端運算服務,去建立他們自身的系統),由一開始便沒有造福全人類的想法,一心只搞數個寡頭壟斷。美國的資本體制下,巨頭們需要對投資人負責,一向都極度追求利潤。

近兩年美股炒起不少AI股,一間三萬億市值的芯片龍頭,但面向應用端的產品完全沒出現,估值明顯不合理。業界過去數年信奉為鐵律的Scaling Law,利用大量高端GPU芯片做運算,把LLM模型越做越大,算力愈來愈猛,便可處理更多大數據,這才能開發出應用AI。這個遊戲到了現在或許值得反思。

AI經過過去數年的快速發展,世上遺留下來還未訓練的數據已不多(對比數年前的狀況),這樣的話,市場早晚都會問一個問題:到底什麼時候才會出現消費者願意付費的AI消費產品?

從過去百年的科技各細分行業發展規律去看,首階段的領先者都不能持續壟斷到最後,中後段有中小型創業者利用前人走過的路,再另找路徑去突破巨企的圍堵,反撲巨頭成功的例子屢見不鮮。若現在便有人斷言,AI走到成熟應用的階段,領先的企業依然是現時最大的科技龍頭霸佔(Nvidia / Amazon / Meta / Microsoft / Google),這才算是天大奇事。

有關科技歷史發展,我建議Engines that move markets (by Alasdair Nairn),這絕對是一本好書。

DeepSeek的出現給不少中小型開發者帶來希望。或許,做到應用型的產品,根本不需要數百億投資在芯片上,LLM可大規模縮小,只需處理精專細分業務的工作,便足以做到滿足大眾需求的產品。簡單的例子如手術室內的AI機械人不需要處理有關自動駕駛的數據,或建築應用的AI機械人不需懂歷史知識等等。這樣的話,不需要最高階的芯片或許已可做到相關產品。

行業規模化生產落地,相宜的人力成本如頂尖工程師的分紅與工資,市場找到足夠大的應用需求,再加上數據中心需要大規模配搭電網(美國的電力基建系統完全不能接收用電量的大幅提升),當中需要政府有效率地配合,再加上各AI子行業需要的大數據也需要政府配合調配數據資源。綜觀全球,只有中國能滿足所有條件。

本年剛開始,AI界出現這個大突破,我相信對AI行業的進展是好事,向AI普遍性應用踏前一大步。

Friday, January 27, 2017

網上課程與人工智能

數星期前利用睡前的空檔登入Coursera看看(噢對了很多香港的年輕人完全未聽過Coursera) 好奇心驅使下試看了有關人工智能的課程片段不得了驚世大發現課程內容實在引人入勝雖然我對研究股票其他投資產品世界性經濟政治什至一些人文科學也有不同程度的興趣但若論有趣程度當然遠比不上此課程吧

  
近數天差不多所有晚上都在看教程做當中的功課測驗等著實好玩

網上課程是一個偉大發明參與者可在任何時間或地點學習費用全免對一個有好奇心的成人而言可把它看成一個活寶貝當然對世事沒好奇心的成人例如一些強調自己已經財務自由身家以億計的文化乞丐他們的看法可能是: 這一些無聊東西只有工資奴才有興趣去看吧

先旨聲明小弟純理科出身所以人工智能中運用的數學或電腦技巧個人很快便可到達一定的理解程度(其實以難度而言當中所用的數學或電腦知識只能算是大學Year1/Year2的東西吧) 當然人人能力背景或興趣不同不過個人相信有求知慾的成人都會對不同課程感到一些好奇的有一些跟人文類有關的課程當中的習作似會安排跟世界各地的學生分組討論有趣有趣

其實課程短內容中有不少技巧性的細節由於時間關係講者只能簡單概述 令人感到此類網上課程似是專為學生打開好奇的心靈有心力去研究的人自然會自學更多小弟將來也會認真多看有關的東西

當然人工智能的研究已有數十年歷史近十年電腦運算能力大增以致此領域發展神速大趨勢走不了 此領域的眾多應用還未普及更可說是整個潮流未正式開始身為這個年代的人當然期待後續進展

世界上有一些地方或國家政府大力推進有關研究近數年迪拜政府已多次強調要變身為Smart City政府大小不同部門都有自己的智能手機應用程式銀行基本服務櫃台愈來愈少差不多由電子交易全面取代

對於新科技他們自然支持官方機構或私人企業進行研究下一個月舉行的人工智能展覽會將會展示不同參與者的新制品 我是鐵定會到場支持的好好研究參觀一下

雖然本地人中有部份確是好食懶做但近一兩年已看到部分年輕一代的求知慾大增上進勤力再加上本地政府在教育和科技上投入和推動實在是一個充滿活力的地方

在此不得不說出個人心聲俗語說: 後生仔90後或2000後最緊要去嘗試做自己喜歡的事起碼將來不會後悔同後生仔傾計梗係想講多d有關一帶一路人工智能電子貨幣無人機眾籌唔通開口埋口都係買樓收租同財自咩?