每個(gè)人身體里都有一個(gè)“杠精”:“這可不一定”“我可不這么認(rèn)為”“那可說不準(zhǔn)”……這些“杠”詞要么在心里默念、要么在口中碎碎念、要么大聲講出來,無論是否表達(dá),“杠”的意識(shí)出現(xiàn)均是人類獨(dú)立思維的表現(xiàn),所基于的正是人類的綜合分析能力。
如今,人工智能(AI)也開始“杠”得有條理、有邏輯、有思路起來。日前,在百分點(diǎn)舉辦的無界智能發(fā)布會(huì)現(xiàn)場(chǎng),IBM大中華區(qū)全球信息科技服務(wù)部總經(jīng)理謝少毅介紹了人工智能做辯論的項(xiàng)目,“杠精”們大愛的口頭禪出現(xiàn)在了IBM的人工智能系統(tǒng) “Project Debater”口中,這背后是機(jī)器學(xué)習(xí)、自然語言處理、海量數(shù)據(jù)搜索處理、識(shí)別情緒等大量人工智能技術(shù)的應(yīng)用。
越來越多的人工智能研究者發(fā)明新的技術(shù)讓AI向人類“偷師”,一定程度上習(xí)得觸類旁通、獨(dú)立思考的能力。從“傻白甜”到“杠精”,AI向真實(shí)的“人”又貼近了一步,從“感知智能”慢慢走向“認(rèn)知智能”,哪些技術(shù)是AI不可或缺的?還有哪些仍待攻堅(jiān)呢?
從理解語義到“讀心術(shù)”,認(rèn)知智能初現(xiàn)
“你告訴一個(gè)AI自己有減肥計(jì)劃,AI如果每天建議你吃沙拉,你就會(huì)說它不好,不符合心意;如果它天天讓你吃蛋糕,你也會(huì)說它不好,不符合減肥需求。”上海紐約大學(xué)商學(xué)部主任陳宇新教授舉了個(gè)連真正的人類都難以把握的兩難抉擇,充分說明理解語義并不一定能夠真正把握要義。
“雖然主人說這是我想要的,但AI做了之后,主人仍會(huì)說這不是他想要的……”擁有“認(rèn)知智能”的未來AI將充分理解這句堪比繞口令的實(shí)質(zhì),陳宇新認(rèn)為,當(dāng)數(shù)據(jù)足夠多、算法足夠強(qiáng)大、模型足夠優(yōu)秀之后,AI將從理解語義到擁有“讀心術(shù)”,分析推測(cè)出人類當(dāng)時(shí)可能都不確定的真正想法,在人心里矛盾時(shí)給出“撓到癢處”的答案。
將這個(gè)“減肥吃什么”的難題放大來看,就是對(duì)正反的“兩難”進(jìn)行一系列諸如身體指征、愛好、時(shí)間等多維度的數(shù)據(jù)綜合分析后,用到大量的人類學(xué)、心理學(xué)、社會(huì)學(xué)的內(nèi)容和方法,通過一系列探索性地問答獲得數(shù)據(jù),給出結(jié)果。
這種探索性的分析將使AI得到進(jìn)化,并擁有更廣闊的“職業(yè)”選擇。據(jù)介紹,美國有公司做出了第一個(gè)人工智能律師ROSS,美國一個(gè)律師以往用上百上千個(gè)小時(shí)做一個(gè)案例的分析和調(diào)查,現(xiàn)在用了ROSS和人一起合作,時(shí)間減少到28分鐘,ROSS,可以提供正反雙方的意見讓律師做決策。
“正反意見的博弈還可以幫高層做決策,可以通過一個(gè)機(jī)器人提供正反兩面意見的辯論,幫助高層綜合分析做更好的決策!敝x少毅認(rèn)為,這方面的研究才剛剛開始。進(jìn)化的AI將被用在更多需要做信息分析或做決策的領(lǐng)域,例如高級(jí)銷售、經(jīng)濟(jì)分析師、企業(yè)高級(jí)管理人員等。
數(shù)據(jù)動(dòng)態(tài)融合,AI走進(jìn)認(rèn)知智能的“基石”
從海量數(shù)據(jù)中“摘出”與當(dāng)前任務(wù)關(guān)聯(lián)的數(shù)據(jù),是AI擁有綜合分析能力的第一步。百分點(diǎn)董事長兼CEO蘇萌表示,AI走進(jìn)認(rèn)知智能首先建立在數(shù)據(jù)融合的基礎(chǔ)上。
以辯論項(xiàng)目為例,沃森化身的這位“女性”辯手,和另一位人類辯手就“是否應(yīng)該把體育博彩合法化”的議題展開辯論時(shí),能在聽懂人類長達(dá)4分鐘的快速陳述(700—900個(gè)單詞)后,進(jìn)行迅速反應(yīng),搜集資料、選取角度,給出旁征博引的辯駁;在短兵相接的短辯交鋒中也能很快理解對(duì)方的觀點(diǎn)、組織語句并做出有針對(duì)性的論述。
蘇萌表示,數(shù)據(jù)目前來看仍然是人工智能的基石。不久前,德國商業(yè)軟件巨頭SAP以80億美元收購全球最大在線調(diào)查公司Qualtrics,說明了數(shù)據(jù)融合的重要性。2017年,百分點(diǎn)也并購了中國最大的在線調(diào)研服務(wù)商極速洞察,使得百分點(diǎn)同時(shí)擁有高達(dá)380萬的中國最大用戶樣本庫,將雙方的行為數(shù)據(jù)和態(tài)度數(shù)據(jù)進(jìn)行融合。
數(shù)據(jù)融合包括擁有海量數(shù)據(jù)和實(shí)現(xiàn)高效融合兩方面。
蘇萌表示,數(shù)據(jù)融合指的是打破業(yè)務(wù)系統(tǒng)的煙囪融合海量的多元異構(gòu)的數(shù)據(jù),它既是一次企業(yè)內(nèi)外部數(shù)據(jù)的融合,也是大小數(shù)據(jù)的融合,同時(shí)也是歷史數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù)的融合,只有數(shù)據(jù)融合了之后,才能洞見真相避免偏見,才能明智決策避免武斷。
“知識(shí)圖譜是我們讓機(jī)器去了解、認(rèn)識(shí)人類世界的核心,它把我們的知識(shí)構(gòu)建成網(wǎng)狀的知識(shí)結(jié)構(gòu),再通過人機(jī)交互直接輸出。”蘇萌進(jìn)一步解釋,數(shù)據(jù)融合意味著知識(shí)需要不斷更新,但在更新一個(gè)知識(shí)點(diǎn)的時(shí)候往往需要更新整個(gè)知識(shí)系統(tǒng),操作非常繁瑣。
“出版行業(yè)或者媒體,甚至公安行業(yè),所涉及的知識(shí)都需要實(shí)時(shí)動(dòng)態(tài)理解,某一個(gè)知識(shí)不是固定不變的,所以知識(shí)圖譜未來的發(fā)展方向是動(dòng)態(tài)知識(shí)圖譜! 蘇萌解釋,這個(gè)世界由很多的東西構(gòu)成,比如人、事、地,這些可以理解為本體,本體發(fā)生變化或者本體間的關(guān)系發(fā)生變化后,動(dòng)態(tài)知識(shí)圖譜能夠迅速自動(dòng)重構(gòu),高效地實(shí)現(xiàn)對(duì)一個(gè)行業(yè)的知識(shí)圖譜的構(gòu)建。
攻堅(jiān)在路上,來自小數(shù)據(jù)的挑戰(zhàn)
新的領(lǐng)域、沒有海量樣本、訓(xùn)練速度不夠,是不是每遇到一個(gè)特殊場(chǎng)景,都要重新建模,輸入大量的樣本讓機(jī)器重新學(xué)習(xí)一次呢?條件并不允許。
“很多客戶的實(shí)際應(yīng)用場(chǎng)景是數(shù)據(jù)量不夠甚至是比較少的,在這種情況下我們結(jié)合遷移學(xué)習(xí)技術(shù),解決了小樣本的模型訓(xùn)練問題,標(biāo)注量只有以往的10%!卑俜贮c(diǎn)首席算法科學(xué)家蘇海波說。
從小數(shù)據(jù)中獲得學(xué)習(xí)能力,也是人工智能走向認(rèn)知智能的一個(gè)重要部分。人工智能專家經(jīng)常用貓舉例:小孩子認(rèn)得貓只要指給他看一兩次就夠了,AI卻需要成百上千張圖片,才能掌握貓的特征。
為此,人工智能科學(xué)家嘗試結(jié)合遷移學(xué)習(xí)開發(fā)一系列算法,節(jié)約人工標(biāo)注樣本的時(shí)間,讓模型在少量的標(biāo)注數(shù)據(jù)上,也能取得好的效果,可以理解為賦予AI“舉一反三”的能力!袄缦耠娚淘u(píng)論情感分類這樣一個(gè)任務(wù),用傳統(tǒng)的深度學(xué)習(xí)模型需要數(shù)萬條數(shù)據(jù)才能達(dá)到85%左右的效果,但是如果采用深度遷移學(xué)習(xí)技術(shù),數(shù)百條數(shù)據(jù)就能達(dá)到同樣的效果!碧K海波說,我們判斷認(rèn)知智能未來會(huì)迎來黃金十年的發(fā)展,為此百分點(diǎn)成立了認(rèn)知智能實(shí)驗(yàn)室。除了深度遷移學(xué)習(xí)技術(shù),實(shí)驗(yàn)室還會(huì)重點(diǎn)研發(fā)多語種自然語言處理技術(shù),幫助認(rèn)知智能實(shí)現(xiàn)跨種族、國際化。
“未來我們會(huì)與各大高校和研究機(jī)構(gòu)開展合作,建立聯(lián)合實(shí)驗(yàn)室,共同探索更多前沿的認(rèn)知智能技術(shù),包括各個(gè)重點(diǎn)行業(yè)的知識(shí)圖譜構(gòu)建、自動(dòng)問答等等。基于這些技術(shù),實(shí)驗(yàn)室會(huì)研發(fā)出更多行業(yè)落地的應(yīng)用產(chǎn)品,為客戶創(chuàng)造價(jià)值,用認(rèn)知智能推動(dòng)社會(huì)進(jìn)步!碧K海波說。(記者 張佳星)