第159章 橘子大模型(第二更)
做一個人工智能,不是方豫給柚子吩咐一下就可以的。
可能是出於安全方面的考慮,塞卡利斯在創造柚子的時候,並沒有給這個球添加自主創新意識。
只有柚子的所有人對它下達明確的指令,他纔會就指令進行下一步的信息收集與演算。
對於一個系統性的任務,柚子需要主人給他把系統性任務分解成爲一個個獨立而明確的任務。
如果方豫只是告訴它:柚子,做一個通用型人工智能出來。
它會完全不知所措,也無從著手,它不會去主動分析這個任務需要什麼樣的前置知識,也不會創造性的去執行這個任務。
這樣一來,就需要方豫自己先對人工智能大模型有相當的瞭解纔可以。
給柚子指明一個方向,分解任務,柚子執行。
如果執行成功,那就是搞成了,如果不成功,說明方豫對人工智能的理解有問題,方向不對,就需要換方向。
歸根究底,柚子這麼懶也是有原因的!
“現在,把我剛纔說的方案做一個初步推演,然後把推演結果告訴我。”方豫一邊給柚子下指令,一邊噼裡啪啦的在電腦上改總結。
柚子寫的階段總結太超前了,方豫得刪除一部分,還得改錯一部分,再交給童永山。
現在方豫已經在童永山心目中建立起了計科高手的印象,索性一階段童永山就沒再找任何計科專業的大佬合作,而是直接和柚子科技達成的合作研究意向。
至於說柚子科技是誰的,童永山更不在乎。
就算這家公司就是自己這個學生的又能怎樣?有一個肯投幾千萬在科研上的二代學生不香嗎?
要是被其他教授知道,早就嫉妒壞了吧?
“主人,ResNet與DBN的結合對處理長距離依賴關係的能力應不會有任何提高,我們需要更換模型組合。”經過短時間的運算,柚子閃著銀白色的星光回答道。
“那就替換一下,看看哪些模型之間能擦出火花來。”方豫在服務器上圈定了模型範圍,交給柚子進行演算。
模糊演算是柚子本身所具備的法則之一,本質其實是預言學派的一些基礎理論在柚子身上的應用。
與計算機模型中提取關鍵因子進行模糊演算的方式完全不同,相比起來,柚子的模糊演算準確性要高得多。
“找到了!”沒過多久,柚子就發出了振奮的聲音。
“《帶注意力的序列到序列》中提到的注意力機制模型與位置編碼技術和LSTM、CNN、FFN等神經網絡的結合,可以形成新的框架,經過訓練後添加其他模型,可以形成目前測算中效率最高的大模型。”柚子迅速在方豫的電腦屏幕上投出了相應內容。
“我會把這些模型放到我自己的框架內,由我的框架進行重組。”
說著,柚子身上的銀色星光逐漸變成了一條緩慢流轉的光帶,這是柚子在用自己的本體幫助陣列服務器進行輔助運算,再把輔助運算的結果傳輸至服務器網絡。
只要找對了路,柚子的運算能力遠非現如今任何一臺超級計算機所能相提並論的。
不過三分鐘,身上流淌的銀色光帶便重新變回了點點銀色星光。
“框架重組完成,底層法則添加完畢,上傳服務器系統後進行初次學習。”柚子平鋪直敘的聲音傳來,似乎變了一個球,跟電影裡的人工智能一樣。
方豫不爲所動搓了搓手指:“好好說話!”
柚子明顯一激靈,語氣諂媚:“主人,大概還要30秒,新的框架就能上傳至服務器,其後就可以做模型數據訓練了。”
話說著,體積並不大的框架模型已經完整上傳至服務器機組,服務器內的柚子分身就開始往新框架中添加處理過的數據。
12組GPU服務器、196顆TeslaM60算力全開,服務器的散熱風扇以一萬五千轉的速度旋轉著,將熱量排至這不足五十平米的空間中。
“目前已完成40GB的數據清洗,現在開始用這部分數據進行第一次訓練,這個模型需要30萬步的迭代可以完成收斂,預計將耗時3小時21分。”
隨後,方豫的屏幕上出現了一個3小時21分20秒的倒計時。 方豫搓了搓手,在屋子裡走了兩圈,心情既期待又激動。
如果這個模型經過數據訓練,能夠表現出一定的分析處理能力和交流能力,就意味著,自己真的搞出了一個可用的人工智能大模型!
你說是柚子搞的?
屁,老子是通訊作者懂不懂?
確定研究方向、劃分研究階段、指導研究內容,老子乾的就是導師的活兒。
課題完成了,導師就做了這些,誰敢說這課題不是導師搞的?
科研懂不懂?科研的事情,能說是壓榨嗎?能說是剝削嗎?能說是黑心嗎?
這種說法,完全無視科研領軍人物的貢獻呀!
你說童永山不給老子一作?
呔!你這黑了心的老賊!學閥!不要臉的黑心導師!
方豫轉了兩圈,爲了平復自己的情緒,乾脆又跑到威斯汀,和那四個正準備逃跑的海賊世界的入侵者又大戰了一場。
海賊世界的入侵者被入侵的快不行了。
三個小時後退房時,四個人都是O字腿。
方豫再次回到機房的時候,40G的模型數據已經訓練完畢了。
“主人,40G的數據已經訓練完畢,其中20G是周文數據,20G是盎文數據。從收斂情況上看,這次訓練是成功了,我們可以針對這個模型進行一些測試。”
方豫的電腦屏幕上出現了一個簡易的對話框,這是柚子剛剛製作的一個UI界面。
“你好。”方豫在對話框中輸入了兩個周文。
“我不好。”對話框中瞬間出現三個字。
艸?什麼情況?你這數據清洗的有問題啊,用什麼數據訓練的?
柚子一臉汗,“這個,這個,可能用來訓練的數據有點問題,我再清洗一遍啊。”
服務器又瘋狂運轉了幾分鐘,40g的數據便又清洗完成。
“重新訓練大約需要1小時20分鐘。”柚子的聲音有些尷尬。
方豫無奈,看看天色,已經下午四點了。
本來還想著去拳擊社虐虐菜裝個逼,看來也沒時間了。
還是在這等著吧。
方豫不是浪費時間的人,一個小時二十分鐘,足夠他複習一門待考科目的。
終於,倒計時結束。
方豫再次在對話框中輸入你好兩個字。
“你好,請問有什麼可以幫您?”這次回覆就正常多了。
“你叫什麼名字?”方豫又敲出一行文字。
模型中規中矩的回答:“我還沒有名字,我是柚子科技開發的一款基於多重神經網絡的大模型,你想叫我什麼?”
方豫想了想,嘴邊露出一絲微笑:“既然你是柚子開發的,那就叫你橘子吧。”
(本章完)