對于研究人員檢查文件中的意見事實并檢查文件非常重要 反復(fù)。 但是,過去檢查和復(fù)制紙張并不是一件容易的事。 華盛頓大學(xué)和艾倫人工智能研究所的 研究人員表示,
對于研究人員檢查文件中的意見事實并檢查文件非常重要 反復(fù)。 但是,過去檢查和復(fù)制紙張并不是一件容易的事。 華盛頓大學(xué)和艾倫人工智能研究所的
研究人員表示,他們已經(jīng)開發(fā)了一種稱為verisci的AI系統(tǒng),該系統(tǒng)會自動根據(jù)科學(xué)思想檢查事實。 論文,面孔或小說:驗證科學(xué)主張,于5月1日發(fā)布在預(yù)印本網(wǎng)站arXiv上。根據(jù)該論文,該AI系統(tǒng)不僅可以識別支持或反對研究思想的摘要,還可以從摘要中提取證據(jù)。 為自己的預(yù)測提供證據(jù)。
是事實檢查論文中觀點的另一個重要角色,即可以幫助解決科學(xué)文獻重復(fù)的問題。 在文獻中,很難找到研究的可重復(fù)性。 2016年,對1500位科學(xué)家進行的民意測驗顯示,其中70%的人試圖復(fù)制文獻,但未能實現(xiàn)。 特別是
,研究人員首先建立了一個語料庫。 該語料庫包含:科學(xué)主張; 支持或反對科學(xué)主張的摘要; 合理的標(biāo)注依據(jù)。 然后,使用引文技術(shù),該方法可以在科學(xué)文獻中標(biāo)記科學(xué)主張,然后研究人員根據(jù)BERT模型(Google引入的雙向編碼器表示模型,即自然語言處理領(lǐng)域的模型)對系統(tǒng)進行訓(xùn)練。 ,以便識別句子并標(biāo)記每個聲明。 根據(jù)介紹
,該科學(xué)數(shù)據(jù)集從5183個摘要語料庫中檢查了1409個科學(xué)視圖。 這些摘要是從包含數(shù)百萬篇科學(xué)論文(s2orc)的公共數(shù)據(jù)庫中收集的。 為了確保只收錄高質(zhì)量的論文,研究小組取消了少于10篇引文和部分論文,并從一系列涵蓋基礎(chǔ)科學(xué),臨床醫(yī)學(xué)和其他領(lǐng)域的廣受好評的期刊中隨機抽取了樣本。 同時,為了標(biāo)注sciface,研究人員招募了一組注釋器。 注釋者的工作是從原始文章的上下文中找到被引用的句子,然后根據(jù)引用來重寫三個觀點。 有必要確保觀點與原始含義一致。 另一方面,自然語言處理專家負責(zé)創(chuàng)建關(guān)鍵字反過濾以獲得摘要反駁關(guān)鍵字的示例。 這樣做還避免了引入明顯有偏見的科學(xué)觀點。 注釋者使用支持,拒絕或缺乏信息來標(biāo)記論文摘要,并適當(dāng)標(biāo)記支持或拒絕的原因。 研究人員還介紹了干擾因素,以避免在同一文章的不同段落中出現(xiàn)相同的引文句子。
該語料庫包含:科學(xué)主張; 支持或反駁科學(xué)主張的摘要
scifact的數(shù)據(jù)集建立后,訓(xùn)練verisci模型包括三個部分:摘要檢索,即與給定觀點的相似度最高的摘要的檢索; 基本原則選擇,可以確定每個候選人摘要的基本原則; 標(biāo)簽預(yù)測,這是最終的標(biāo)簽預(yù)測。 在實驗中,研究人員說,該系統(tǒng)可以正確識別支持或反駁標(biāo)簽的可能性的一半(46.5%),并提供合理的證據(jù)。 為了證明該系統(tǒng)的通用性,研究團隊圍繞新型冠狀病毒的科學(xué)論文進行了實驗演示。 根據(jù)該報告,醫(yī)學(xué)生評論員認為,與新冠狀病毒有關(guān)的Verisci的大多數(shù)觀點(36種觀點中的23種)被認為是合理的,表明該模型可以成功檢索和分類。但verisci并不完美,因為它經(jīng)常被上下文所混淆,無法綜合論證,或無法整合來自不同來源的信息來進行判斷。
“科學(xué)事實檢查提出了一系列獨特的挑戰(zhàn),這些挑戰(zhàn)擴大了神經(jīng)模型在復(fù)雜的語言理解和推理中的局限性。盡管它的規(guī)模很小,但與用維基百科文章和政治新聞構(gòu)建的事實檢查數(shù)據(jù)集相比,verisci的訓(xùn)練更加熟練,而且具有記號 研究人員在論文
中說:““這項研究提供了希望,但是我們的發(fā)現(xiàn)表明,需要進一步的工作來改善端到端事實檢查系統(tǒng)的性能! 下載“ sursuring news”應(yīng)用以獲取更多原始信息)
美國國家航空航天局已發(fā)出近10億 Dell的新款Precision 7000系列移 蘇寧中華第一店的“倒退”顯示出 Microsoft Surface go 2已通過En 如何連接裝修工人的訂單接收平臺 這21個應(yīng)用程序是非法的! 您可 YouTube每分鐘產(chǎn)生32000美元的廣 頻頻挖角高管抱怨午夜,魅族的應(yīng) 當(dāng)場推翻原版! AI不承認上帝, 數(shù)字基礎(chǔ)共享視頻介紹了VRS可變 北通云企業(yè)照明站,3分鐘發(fā)布一 100智能大廈 新聞:2020年13英寸Macbook Pro 閱讀對最近查詢的回應(yīng):全面推動 餐飲業(yè)的創(chuàng)新,變革和利潤保證 國家緊急響應(yīng)為2級或以下; 特斯 巴菲特:尚未找到感興趣的公司 Apple的新消息專利:重新編輯發(fā) 沒有贏得原始的跑步成績,并且沒 長鑫家用DDR4內(nèi)存芯片/顆粒處理 在原始的win10中搜索其他瀏覽器 巴菲特的Alpha:使用機器學(xué)習(xí)量 圖片預(yù)覽界面中的新增長焦點圖片 巴菲特:麝香做得很棒,但不會投 閱讀:作家座談會于5月6日啟動, 原始IOS 13.5 beta 3帶來了有關(guān) 中國人民銀行:恢復(fù)生產(chǎn)的狀況正 原裝國內(nèi)最差的手機系統(tǒng):華為的 比亞迪與華為合作! 趙長江:特 經(jīng)典gal“ MUV luv”將發(fā)布在Ste