ChatGPT水土不服？期待生成式AI“中國(guó)制造”

2023-03-05 20:01:25來(lái)源：財(cái)訊網(wǎng)

全班第一的論文是它寫(xiě)出來(lái)的、89%的美國(guó)學(xué)生用它來(lái)完成作業(yè)、2個(gè)月內(nèi)超過(guò)1億用戶向它提問(wèn)……最近一段時(shí)間，聊天機(jī)器人ChatGPT火遍全球，它以強(qiáng)大的語(yǔ)言處理能力、海量的數(shù)據(jù)積累等特點(diǎn)讓用戶感到驚訝甚至震撼。但隨著使用的人越來(lái)越多，ChatGPT開(kāi)始暴露在一些場(chǎng)景下的缺陷和不足，讓網(wǎng)友吐槽“智障”。

另外，ChatGPT在中文語(yǔ)境下的表現(xiàn)也差強(qiáng)人意，存在很多錯(cuò)誤，也經(jīng)常胡編亂造。究其原因，ChatGPT等大型語(yǔ)言模型需要大量的計(jì)算資源和數(shù)據(jù)才能夠進(jìn)行訓(xùn)練，而目前，ChatGPT被“投喂”的數(shù)據(jù)主要都是英文數(shù)據(jù)，處理文本時(shí)也是基于處理英文的方法理解和生成，而中文的語(yǔ)法與英語(yǔ)有很大不同，受到語(yǔ)言障礙、文化差異的影響，ChatGPT勢(shì)必對(duì)中文、中國(guó)文化“水土不服”，無(wú)法適應(yīng)中國(guó)的環(huán)境和要求。

因此，中國(guó)需要自己的生成式AI，哪怕不完美。即將上線的百度文心一言，代表中國(guó)生成式AI產(chǎn)品站在了全球技術(shù)競(jìng)賽場(chǎng)上，是巨大的勝利，意義非凡。

ChatGPT=人工智障？

對(duì)于ChatGPT的“人工智障”表現(xiàn)，用戶反映最多的問(wèn)題是它經(jīng)常“一本正經(jīng)地胡說(shuō)八道”。經(jīng)常存在事實(shí)性錯(cuò)誤，無(wú)法判斷它回答的對(duì)錯(cuò)。不僅僅是在中文相關(guān)的題材下，就連在西方知識(shí)題材中也會(huì)胡言亂語(yǔ)。將王勃《滕王閣序》的詩(shī)句說(shuō)成出自王煥之《登鸛雀樓》，將鋼琴女祭司瑪塔·阿格里奇說(shuō)成20世紀(jì)最杰出的小提琴家之一。

并且有時(shí)結(jié)果并不穩(wěn)定，換個(gè)問(wèn)法后甚至刷新一下ChatGPT的回答可能會(huì)變化。

并且ChatGPT并不誠(chéng)實(shí)，也無(wú)法查詢獲知最新的信息和知識(shí)。這在一些垂直領(lǐng)域的使用中，特別是像高?？蒲羞@種需要前沿研究和實(shí)時(shí)數(shù)據(jù)的場(chǎng)景下，實(shí)屬不便。問(wèn)詢前沿問(wèn)題，讓它幫忙查找一篇論文，它的回答看起來(lái)有條有理，但DOI指向的是另一篇論文，題目和作者甚至都是捏造不存在的。

對(duì)于互聯(lián)網(wǎng)上含有大量非英語(yǔ)語(yǔ)言，比如中文，沒(méi)有豐富的中文訓(xùn)練數(shù)據(jù)，它有時(shí)就會(huì)胡言亂語(yǔ)。甚至當(dāng)問(wèn)題就是錯(cuò)的時(shí)，ChatGPT仍然會(huì)順著往下說(shuō)，一騙就上當(dāng)。

再退一步，不在query設(shè)置專(zhuān)業(yè)限定詞，而是簡(jiǎn)單問(wèn)題，ChatGPT在中文語(yǔ)境的錯(cuò)誤還是比較多的。

當(dāng)ChatGPT脫離通用領(lǐng)域來(lái)到需要極其豐厚的領(lǐng)域知識(shí)的垂直領(lǐng)域，它還不一定合適。下圖是ChatGPT在中文字詞相關(guān)問(wèn)題上的回復(fù)，涉及拼音相關(guān)的知識(shí)，盡管好像有一些道理，但結(jié)果是錯(cuò)誤的。

文心一言：中國(guó)自己的生成式AI

以上提到的一些缺陷，無(wú)疑說(shuō)明了ChatGPT距離“完美”依然有著不小的距離，比如中文基準(zhǔn)的自然語(yǔ)言處理效果、面對(duì)國(guó)內(nèi)用戶的限制、不能獲取新的知識(shí)等。在當(dāng)前全球的ChatGPT熱潮下，中國(guó)更應(yīng)該有自己的生成式AI產(chǎn)品，哪怕不完美。

在這樣的背景下，百度文心一言，作為一家中國(guó)自研的生成式AI產(chǎn)品，站在了全球技術(shù)競(jìng)賽場(chǎng)上，與世界爭(zhēng)鋒，即使不完美，也是英雄。這不僅對(duì)于我國(guó)人工智能技術(shù)的發(fā)展和國(guó)際數(shù)據(jù)爭(zhēng)奪意義重大，也彌補(bǔ)了我國(guó)缺乏與國(guó)外人工智能對(duì)話機(jī)器人相匹配的人工智能技術(shù)帶來(lái)的一系列隱患。

據(jù)介紹，文心一言由最新大語(yǔ)言模型（LLM）提供支持，是繼文心一格之后百度的又一個(gè)生成式AI產(chǎn)品。文心一言的全部代碼、訓(xùn)練平臺(tái)全部是百度自研，放眼中國(guó)，目前為止還沒(méi)有第二家能夠做到。

百度在人工智能領(lǐng)域深耕十多年，在技術(shù)上有綜合優(yōu)勢(shì)，基礎(chǔ)能力已完全具備。百度創(chuàng)始人、董事長(zhǎng)兼CEO李彥宏曾表示，人類(lèi)進(jìn)入人工智能時(shí)代，IT技術(shù)的技術(shù)棧發(fā)生了根本性的變化。過(guò)去基本分為三層：芯片層，操作系統(tǒng)層和應(yīng)用層?，F(xiàn)在可以分為四層：芯片層、框架層、模型層和應(yīng)用層。百度是全球?yàn)閿?shù)不多、進(jìn)行全棧布局的人工智能公司，從高端芯片昆侖芯，到飛槳深度學(xué)習(xí)框架，再到文心預(yù)訓(xùn)練大模型，各個(gè)層面都有領(lǐng)先業(yè)界的關(guān)鍵自研技術(shù)，可以實(shí)現(xiàn)端到端優(yōu)化，大幅提升效率。

文心一言處于四層技術(shù)架構(gòu)中的模型層。根據(jù)百度官方對(duì)外披露的信息，百度的文心大模型，在2019年就已經(jīng)推出，并且已經(jīng)迭代了多代，從單一的自然語(yǔ)言理解延伸到多模態(tài)，包括視覺(jué)、文檔、文圖、語(yǔ)音等多模態(tài)多功能，百度文心系列大模型在行業(yè)已普遍應(yīng)用，而能支撐該訓(xùn)練模型的框架，目前國(guó)內(nèi)沒(méi)有誰(shuí)可以超越百度飛槳。

在國(guó)內(nèi)，百度的文心一言，還可能在一些地方實(shí)現(xiàn)對(duì)ChatGPT的超越。

百度有多年的搜索經(jīng)營(yíng)積累，在真實(shí)數(shù)據(jù)和用戶需求理解方面，有較強(qiáng)的先發(fā)優(yōu)勢(shì)。因此，相比ChatGPT，文心一言能夠基于檢索增強(qiáng)提升時(shí)效性和準(zhǔn)確性，并基于知識(shí)增強(qiáng)提升多輪推理對(duì)話。

此外，百度擁有最先進(jìn)的中文領(lǐng)域自然語(yǔ)言處理能力，可以說(shuō)在這方面中國(guó)絕對(duì)沒(méi)有一家公司水平接近百度。文心大模型是中國(guó)本土AI模型，具備對(duì)中文、甚至中國(guó)文化的更深理解。相比之下，文心一言會(huì)更適合中文和中國(guó)市場(chǎng)。

據(jù)悉，文心一言發(fā)布后，普通用戶注冊(cè)賬號(hào)可以使用，而隨著內(nèi)測(cè)和開(kāi)放，使用的人越來(lái)越多，文心一言將建立起真實(shí)的用戶、開(kāi)發(fā)者調(diào)用和模型迭代之間的飛輪，模型將越來(lái)越聰明、越來(lái)越完美。

上場(chǎng)即是勝利，哪怕不完美。中國(guó)一定要有自己的生成式AI，無(wú)論是面向C端市場(chǎng)，還是面向B端市場(chǎng)，國(guó)內(nèi)市場(chǎng)都將因?yàn)檫@項(xiàng)技術(shù)，迎來(lái)一輪新的發(fā)展契機(jī)。而文心一言，也將成為與世界爭(zhēng)鋒的英雄，期待未來(lái)它能創(chuàng)造屬于中國(guó)生成式AI產(chǎn)品的奇跡。

免責(zé)聲明：市場(chǎng)有風(fēng)險(xiǎn)，選擇需謹(jǐn)慎！此文僅供參考，不作買(mǎi)賣(mài)依據(jù)。

關(guān)鍵詞：

国模吧双双大尺度炮交gogo,国产午夜三级一区二区三,国产一区二区精品久久岳,国产精品熟妇一区二区三区四区,国产伦孑沙发午休精品

ChatGPT水土不服？期待生成式AI“中國(guó)制造”

推薦內(nèi)容