“拒絕談判?”
太平洋彼岸,阿美瑞卡某處會(huì)客室,一名男子不可置信的看到。
“我就說,他們絕不會(huì)答應(yīng)進(jìn)口核輻射地區(qū)的糧食的,他們跟我們不一樣,他們是有底線的。”
“鮑姆,不對(duì)。我們現(xiàn)在還沒有開始談條件呢,這些東西,我們要談什麼,他們現(xiàn)在不可能知道的。”
“Jacks,那他們爲(wèi)什麼拒絕的如此乾脆?連談都不願(yuàn)意談?究竟哪裡出了問題?
“難道是工業(yè)人工智能模型的未來不夠誘人?還是他們已經(jīng)發(fā)現(xiàn)了什麼?”
“不不不,”傑克斯搖頭:“我們的專家評(píng)估了那麼長(zhǎng)時(shí)間才得出的確切結(jié)論,他們那落後那麼多的水平,專家們即便是猜到了,也絕對(duì)不敢打包票作保證。”
現(xiàn)在的人工智能訓(xùn)練,包括最強(qiáng)大的GPT4.0,都是一樣的原理,就是海量語料和海量算力的堆積。
語言模型,像ChatGPT,海量的語料獲取非常容易,網(wǎng)絡(luò)上爬取就是了,無非就是需要進(jìn)行一番清洗,只要不在乎成本,可以無限堆積。
哪怕是OpenAi和GitHub合作共同訓(xùn)練的代碼機(jī)器人模型,那也有GitHub代碼倉庫裡不計(jì)其數(shù)的代碼做訓(xùn)練支撐。
但工業(yè)模型訓(xùn)練呢?工業(yè)生產(chǎn)數(shù)據(jù)可不像語言和代碼那樣,全網(wǎng)都是,爬取就完了。
哪兒來的那麼多的工業(yè)數(shù)據(jù)來做訓(xùn)練支撐呢?
且不說各家的工業(yè)數(shù)據(jù)都是核心隱私,根本不可能共享。就算能也沒用。
智庫評(píng)估,哪怕把全美甚至全世界的工業(yè)生產(chǎn)數(shù)據(jù)全部擼來,也不夠工業(yè)模型訓(xùn)練之萬一的。
換言之,就是這玩意不可能存在。
……
“是的,不可能存在。”文國昌開完會(huì),立刻就趕往了華州,他要見一見程旭,程旭也是直接了當(dāng):
“文老,以現(xiàn)有的人工智能模型訓(xùn)練方式,至少十幾二十年內(nèi),成熟的大型工業(yè)人工智能模型沒有任何出現(xiàn)的可能。”
“你說的這些,包括,現(xiàn)有工業(yè)生產(chǎn)數(shù)據(jù)根本不可能支撐大型工業(yè)模型的訓(xùn)練這種觀點(diǎn),很多專家也都說了。”
文國昌問道:“但是,他們都不敢這麼保證。你爲(wèi)什麼就敢說十幾二十年不可能?”
“他們是你的智囊團(tuán),要對(duì)你的決策負(fù)責(zé)。”程序笑道:“而我嘛,只是跟一個(gè)老朋友聊聊天,我有什麼不好說的?”
“小鬼頭。”文國昌笑了笑,沒有再糾結(jié)這個(gè)問題,這其中的道道,他比程旭明白。
“你說十幾二十年不會(huì)出現(xiàn)大型工業(yè)人工智能模型,我選擇信你。”
文國昌起身,鄭重的說道:“這個(gè)決策,是我個(gè)人做出的,有我來負(fù)責(zé)。”
“文老,您等會(huì)兒,”程旭立刻制止:“我什麼時(shí)候說過了。”
“你剛纔不是說……”文國昌心中突然一驚,滿臉疑惑的看著程旭。
“文老,我說的可是,以現(xiàn)有的人工智能模型訓(xùn)練方式,是有這個(gè)前提條件的。”
程旭笑道:“換言之,阿美瑞卡不會(huì)有,但我可沒說我們不會(huì)有。”
“價(jià)值判定方法?”文老詢問道。
“文老也知道價(jià)值判定?”
程旭一驚,不過隨後也就明白了,就現(xiàn)在的世界形勢(shì),這麼重要的東西不關(guān)注反倒不正常了。
文國昌點(diǎn)了點(diǎn)頭,也沒有瞞著:“我不想知道也得知道,從昨天到今天,價(jià)值判定這四個(gè)字兒都快把我的耳朵磨出繭子來了。
各路專家分析來分析去,沒有形成統(tǒng)一認(rèn)知。
“認(rèn)爲(wèi)它好的,那叫一個(gè)誇,誇得天上有地下無的,開創(chuàng)人工智能訓(xùn)練新的時(shí)代,這評(píng)價(jià),高的沒邊兒了。
“也有人認(rèn)爲(wèi),它是有點(diǎn)兒突破,但也就那麼回事兒,再怎麼強(qiáng)也強(qiáng)不過阿美瑞卡。畢竟人家起步早,沒有個(gè)三五十年怎麼趕得上呢?還是建議得妥協(xié)。
“現(xiàn)在,我想聽聽,你這個(gè)創(chuàng)造者對(duì)價(jià)值判定是怎麼樣的一個(gè)看法。”
“文老,價(jià)值判定是什麼我就不跟您講了,相信專家們肯定分析過了,講的肯定比我好。”
程旭笑道:“我就給您說說,基於價(jià)值判定核心,出現(xiàn)的一種新的訓(xùn)練模型:我管它叫【條概模型】。”
“現(xiàn)在的人工智能訓(xùn)練模型,不管哪一種,都是概率統(tǒng)計(jì)模型。”
程旭說著,看文老有些懵,瞬間改了一種說法:“這就像什麼呢,我們把人工智能當(dāng)成一個(gè)牙牙學(xué)語小孩兒,我們教一個(gè)孩子學(xué)習(xí)語言。
“現(xiàn)在的模型是怎麼教的呢?給它一大堆的文章,成G成T的給它,它就會(huì)自己去拆解這些文章,統(tǒng)計(jì)字與字、詞與詞之間的組合和出現(xiàn)的概率。
“計(jì)算是計(jì)算機(jī)擅長(zhǎng)的啊,尤其是GPU,專有運(yùn)算能力非常強(qiáng)大,海量的數(shù)據(jù)和算力堆積就形成了現(xiàn)在看似是思考和邏輯的語言能力,其本質(zhì)還是統(tǒng)計(jì)概率。
“而我的條件概率模型呢,開始的時(shí)候是不會(huì)給它海量文章的,它像孩子一樣,先學(xué)識(shí)字、再學(xué)組詞造句、再學(xué)詞性分解。
“訓(xùn)練了完了這些,再給它灌輸中量的文章語料,去統(tǒng)計(jì)這些字這些詞出現(xiàn)的境況概率和詞性分解情況,慢慢的形成看起來具有一定思考和邏輯的語言能力。”
“看起來本質(zhì)還是概率統(tǒng)計(jì)啊!”文國昌笑道。
“對(duì),本質(zhì)還是概率統(tǒng)計(jì),”程旭也笑了:“它形成的東西,也只是看起來具有思考性和邏輯,它自己本身是沒有這個(gè)概念的。
“不過話說回來,如果它真的像孩子一樣,慢慢的形成思維,那就不是強(qiáng)大,而是可怕了吧?”
文國昌點(diǎn)了點(diǎn)頭,他聽懂了。
雖然本質(zhì)還是概率統(tǒng)計(jì),但是條件概率,提前通過某種手段剔除掉了絕大部分不可能的情況,那剔除的這部分,訓(xùn)練量就完全省下來了。
從程旭的話裡邊也非常明顯的聽出來,現(xiàn)有模型訓(xùn)練是海量數(shù)據(jù)堆積、海量算力支撐,而條概模型,是先行基礎(chǔ)邏輯,然後中量數(shù)據(jù)投喂,進(jìn)行統(tǒng)計(jì)分析。
海量,那是沒量,愈多愈善。但,中量——可能也不少,但至少有數(shù)了。
這一比較——
突然想起剛剛說起的工業(yè)人工智能訓(xùn)練模型,按現(xiàn)有的訓(xùn)練方式,全世界的工業(yè)數(shù)據(jù)都不足以支撐。
那條概模型呢?
“條概模型能省多大水平的數(shù)據(jù)?”文國昌也是殷切的問道。
程旭一眼就看出了文老的心思,因爲(wèi)他壓根沒有加以掩飾:
“利用條概模型,我說的是未來的成熟條概模型哈,而不是千尋臨時(shí)用的那個(gè)還不完善的模型雛形。
“利用條概模型,以我國的工業(yè)體系數(shù)據(jù),絕對(duì)足以支撐一個(gè)大型工業(yè)人工智能模型的訓(xùn)練。”
“哈哈哈哈哈哈……”
文國昌仰面大笑,內(nèi)心十分舒爽:
阿美瑞卡是在吹牛、在忽悠,他們一定想不到,我們未來竟然有可能真的實(shí)現(xiàn)吧?