MoneyDJ新聞 2023-03-15 09:09:54 記者 張以忠 報導
ChatGPT爆紅,引發AI應用浪潮,宏正(6277)六年前開始研發AI中文語音合成技術,可做到人聲的快速複製,去(2022)年宏正推出優聲學產品,定為宏正的聲音產品元年,今(2023)年將切入廣播、企業客戶,正式進軍聲音市場。
宏正資深副總經理林勇達(見附圖)表示,公司六年前開始投入聲音領域,用AI技術合成幾乎是自然的語音,可以用在有聲書、企業簡報,只要有稿件給它,就能合成媲美真人的聲音。
林勇達舉例,譬如我們唸「小雨傘」,當中的「雨」正確讀音是三聲雨,但其實在口語表達時,通常會唸二聲,這些細節都會透過AI技術糾正,讓它聽起來更自然。同時,現在甚至可以蒐入外國人的聲音,再模擬出外國人講中文的腔調。
宏正消費產品中心協理張教勇指出,要進行語音合成的訓練,首先,需要大量資料,第二,需要算力,第三,要有人才,從無到有的過程中,我們選擇語音合成,主因其所需算力以及語料相對較少,就可以創造出可靠的商務模式以及聲音產出。
張教勇表示,一開始要投入語音AI需要有很大的心理準備,因為投入實驗一開始就要面臨,要不要買一台500萬元的電腦?因為同時間要做大量實驗,且神經元都有不同設計方式,不同設計方式同時都要跑訓練,需要很強的算力,這部分得說服公司內部同意;其次是人才的挑戰,公司過去從事電子產品製造,但是懂得AI的人才,需要對資料、神經元、程式語言、特殊產業的知識有一定程度專業才行,等於是,需要大量投資硬體與人才,這都要內部同意才行,所幸,內部有給予支持。
相較其他競爭對手的文字轉語音服務,宏正優勢為何?林勇達表示,宏正優聲學僅需以極少量的語料,即可透過最先進的深度學習,即類神經網路演算法,以最快時間內,訓練完成一個模型,為用戶節省大筆經費與時間。
訓練有多快呢?林勇達指出,公司推出的客製化語音,假設請真人錄音一千句左右,就能合成聲音,讓聲音留下來;就像是鄧麗君,以往不朽的聲音只有像她這樣的明星才有這樣的待遇,但宏正的聲音合成技術,讓這樣的服務平民化,一般人的聲音特質都能夠保留下來。
林勇達表示,以商業的角度來看,客製化語音服務,可為企業培養專屬聲優,讓企業不僅擁有圖像識別,更能擁有符合企業特色的專屬聲音識別,為企業品牌加值。
宏正去年定為公司的聲音元年,今年在聲音產品方面,會朝二個方向進行,首先是針對聲音處理技術,推出專業音響系列新品。另一個則是推出AI中文語音合成優聲學。AI合成服務產品將切入包括廣播、企業客戶等領域,正式進軍聲音市場。
(圖片來源:圖為宏正資深副總經理林勇達,MoneyDJ理財網資料庫)