MoneyDJ新聞 2023-12-20 12:05:24 記者 賴宏昌 報導
CNBC週二(12月19日)報導,新創企業Patronus AI發現,類似ChatGPT核心的大型語言模型(LLM)經常無法回答取自證券交易委員會(SEC)公告文件的問題。Patronus AI共同創辦人Anand Kannappan受訪時表示,即使是效能最好的人工智慧(AI)模型配置(OpenAI GPT-4 Turbo)也只有79%的答題正確率。
報導指出,LLM經常會拒絕回答問題或捏造SEC公告文件中沒有的數據。Kannappan指出、將LLM整合到實際產品的挑戰之一在於相同的提問不一定會產生相同的答案,上述表現程度是絕對不可接受的、必須大幅提高正確率後才能整合到自動化流程。
VentureBeat週二報導,Patronus AI科技長Rebecca Qian受訪時表示,Patronus AI在不同的模型規模和團隊中都察覺到有害、不安全的回覆,令人驚訝的是、從70億到400億個參數模型都出現很高比例的不安全答案。
紐約大學教授Gary Marcus發表最新文章指出,谷歌(Google)DeepMind發表的FunSearch不太可能成為解決癌症或生產輕型電池的主要因素。他並且說,LLM事實上並未自行解決數學問題。
Thomson Reuters 11月報導,Marcus表示,生成式AI在編碼時跟其他應用領域一樣很容易出錯,問題在於程式設計師知道如何進行疑難排解。
Marcus 8月撰文指出,幾乎每個人都會犯的根本錯誤就是相信生成式AI等同於通用人工智慧(AGI),問題在於生成式AI仍面臨許多尚未解決的重大挑戰。
慧甚(FactSet)資深盈餘分析師John Butters 12月1日指出,2023年9月15日至11月30日期間舉行財報電話會議的標準普爾500指數成分股當中、152家提及AI,較第2季的180家減少16%。
(圖片來源:Shutterstock)
*編者按:本文僅供參考之用,並不構成要約、招攬或邀請、誘使、任何不論種類或形式之申述或訂立任何建議及推薦,讀者務請運用個人獨立思考能力,自行作出投資決定,如因相關建議招致損失,概與《精實財經媒體》、編者及作者無涉。