“靈犀語音助手”可以圍繞指定文檔,快速抓取內(nèi)容,給出“仔細思考”后的回答。聊天結(jié)束后,助手還可以自動總結(jié)本次聊天內(nèi)容,為用戶生成一份可編輯的文檔,方便后續(xù)回顧。
流暢自然的語音交互背后,“靈犀語音助手”依托火山引擎 RTC 實時音視頻技術(shù)對語音的高效采集與穩(wěn)定傳輸,端到端延遲可以低至1s。
同時,通過豆包·語音識別模型的精準語音識別和豆包·語音合成模型的自然保真的文本轉(zhuǎn)語音技術(shù),“靈犀語音助手”能帶來更具情感力的“真人助手”般對話體驗。值得注意的是,火山引擎的智能音視頻處理模塊能夠消除回聲、抑制噪聲,讓復(fù)雜環(huán)境下語音識別依然準確。
通過上述火山引擎整體語音解決方案,靈犀語音助手讓用戶兼顧“文檔創(chuàng)作”與“AI 助理”的同屏協(xié)作形態(tài),對話式調(diào)整內(nèi)容,創(chuàng)作如聊天般輕松。

WPS靈犀:豆包大模型驅(qū)動,多場景助力AI辦公新體驗
“WPS靈犀”可以依托大模型等 AI 能力,完成跨文字、表格、幻燈片等形式的理解與任務(wù)處理,完成搜索、閱讀、寫作、圖像生成、數(shù)據(jù)分析等眾多場景任務(wù)。
豆包大模型作為“WPS靈犀”背后的核心交互處理引擎之一,可以準確理解用戶意圖并生成高質(zhì)量、上下文連貫的回復(fù),不僅“聽得懂”,更“答得準”。其中,豆包大模型 1.6和豆包·視覺理解模型,可以幫助其高效理解文本、圖片、視頻等資料。同時,當用戶通過自然語言與“WPS靈犀”交流,豆包大模型在意圖理解和指令遵循上能夠有效拆解用戶需求,結(jié)合“WPS靈犀”本身的工程優(yōu)化,有效實現(xiàn)內(nèi)容的快速總結(jié)和核心信息獲取。
在 Deep Research 場景中,“WPS靈犀”利用火山引擎聯(lián)網(wǎng)問答 Agent,對互聯(lián)網(wǎng)公域及抖音內(nèi)容生態(tài)進行高效整合與篩選,通過與權(quán)威信源的深度合作,進一步提升內(nèi)容匹配度,保障搜索結(jié)果的專業(yè)性、時效性。例如,用戶在撰寫報告或制定方案時需要資料支持結(jié)論,即可通過“WPS靈犀”高效獲取精準資料,省去繁瑣查找與比對過程。
除了搜索服務(wù)以外,Deep Research 還依托豆包大模型 1.6支持的自主思考模式,能夠根據(jù)用戶需求的復(fù)雜度和上下文,形成判斷、并且進一步做出任務(wù)規(guī)劃。在任務(wù)執(zhí)行過程中,也能夠通過 Function Call 自動識別并且調(diào)用后端接口來實現(xiàn)文字、表格、演示、PDF 的組件中的不同操作,最終實現(xiàn)思考過程的完整執(zhí)行,形成特定結(jié)構(gòu)下的高質(zhì)量內(nèi)容創(chuàng)作。
另外,在 PPT 創(chuàng)作場景中,“WPS靈犀”不僅通過豆包大模型 1.6等模型能夠快速理解和創(chuàng)作文字內(nèi)容,也結(jié)合了 WPS 在 PPT 編輯組件上多年的積累,有效把對應(yīng)的文字內(nèi)容填入到合適的位置;同時結(jié)合火山引擎提供的搜圖、文生圖 Seedream 3.0以及圖片編輯 SeedEdit 3.0能力,為用戶提供與文字內(nèi)容相關(guān)的配圖,快速解決用戶創(chuàng)作過程中需要二次找圖的麻煩。

為提升辦公生產(chǎn)力,金山辦公聯(lián)合火山引擎攜手探索 AI 與用戶協(xié)作的最佳實踐。未來,雙方將不斷拓展大模型在辦公場景中的應(yīng)用場景,為全球用戶提供簡單、高效、可控的辦公體驗。
海報生成中...