企業(yè)智能體公司元理智能(Yoolee AI)近日完成800萬(wàn)美元種子輪融資,由藍(lán)馳創(chuàng)投領(lǐng)投,光源創(chuàng)業(yè)者基金跟投。
元理智能由智譜AI前COO張帆創(chuàng)立,聚焦以商業(yè)強(qiáng)化學(xué)習(xí)(RL for Busniess)為核心路徑建立可靠自我進(jìn)化的智能體員工,公司希望通過(guò)商業(yè)場(chǎng)景強(qiáng)化學(xué)習(xí),將基礎(chǔ)模型能力轉(zhuǎn)化為可量化的業(yè)務(wù)成果,推動(dòng)AI Agent真正落地。
元理智能創(chuàng)始人張帆是AI領(lǐng)域的連續(xù)創(chuàng)業(yè)者,早年在法國(guó)學(xué)習(xí)人工智能,也曾在國(guó)家科研中心從事機(jī)器翻譯研究。2010年回國(guó)后,他曾在搜狗、騰訊負(fù)責(zé)智能語(yǔ)音產(chǎn)品(類(lèi)Siri產(chǎn)品)研發(fā),后創(chuàng)辦妙計(jì)旅行,擔(dān)任大搜車(chē)CTO;2022年創(chuàng)立元因智能(后被智譜AI并購(gòu)),2023年加入智譜AI任COO,今年6月離職再次創(chuàng)業(yè)。
張帆表示,目前主流Agent to B模式多依賴“定制化+SFT(監(jiān)督微調(diào))”的固定工作流,部署成本高、場(chǎng)景適配慢,并且與模型強(qiáng)耦合,任何模型升級(jí)都會(huì)帶來(lái)巨大的升級(jí)成本,沒(méi)辦法規(guī)?;K栽碇悄苷J(rèn)為強(qiáng)化學(xué)習(xí)出現(xiàn),帶來(lái)新的學(xué)習(xí)范式,以業(yè)務(wù)結(jié)果為導(dǎo)向商業(yè)強(qiáng)化學(xué)習(xí),來(lái)構(gòu)建企業(yè)自進(jìn)化的生產(chǎn)力智能體,使其在真實(shí)商業(yè)環(huán)境中持續(xù)創(chuàng)造商業(yè)價(jià)值。
強(qiáng)化學(xué)習(xí)在代碼生成、數(shù)學(xué)推理等“反饋清晰”場(chǎng)景已取得突破,但在企業(yè)業(yè)務(wù)中面臨更高維度的復(fù)雜環(huán)境。元理智能的核心目標(biāo)在于,通過(guò)結(jié)合業(yè)務(wù)先驗(yàn)與隱性知識(shí),構(gòu)建真實(shí)的獎(jiǎng)勵(lì)函數(shù)與優(yōu)化機(jī)制,讓AI能在復(fù)雜商業(yè)決策中持續(xù)進(jìn)化。
行業(yè)目前有趨勢(shì)性認(rèn)知,強(qiáng)化學(xué)習(xí)驅(qū)動(dòng)的AI Agent正成為全球AI產(chǎn)業(yè)的新方向。OpenAI前CTO Mira Murati創(chuàng)立的Thinking Machines Lab也曾提出,用強(qiáng)化學(xué)習(xí)幫助企業(yè)基于營(yíng)收、利潤(rùn)等KPI定制AI模型。
據(jù)悉元理智能已經(jīng)和多家賽道頭部企業(yè)展開(kāi)合作,共同探索商業(yè)強(qiáng)化學(xué)習(xí)在不同領(lǐng)域的應(yīng)用和落地。