<sub id="qe0ca"><var id="qe0ca"><output id="qe0ca"></output></var></sub>
  • <pre id="qe0ca"><optgroup id="qe0ca"></optgroup></pre>
  • <track id="qe0ca"></track>
    <tr id="qe0ca"><delect id="qe0ca"></delect></tr>
    <tr id="qe0ca"><code id="qe0ca"></code></tr>
    <acronym id="qe0ca"><optgroup id="qe0ca"></optgroup></acronym>
  • <acronym id="qe0ca"><optgroup id="qe0ca"><em id="qe0ca"></em></optgroup></acronym>
      <option id="qe0ca"></option>

    1. <acronym id="qe0ca"></acronym>
      1. 創業頭條
      2. 前沿領域
      3. AI智能
      4. 正文

      谷歌發布多模態大模型重回領先,中國大模型誰能一戰

       2024-05-24 17:02  來源:A5專欄  我來投稿 撤稿糾錯

        域名預訂/競價,好“米”不錯過

      5月14日OpenAI搶跑發布GPT-4o,通過實時的語音、視頻和文本交互刷屏社交網絡。

      但僅僅24小時后,谷歌毫不示弱,在一年一度的Google I/O 開發者大會上,展示了由升級后Gemini模型驅動的AI助手項目Project Astra、對標Sora的文生視頻模型Veo,以及在硬件方面發布的第六代Tensor處理器單元(TPU)Trillium芯片,并推出了徹底AI改造后的搜索。

      谷歌首席執行官桑達爾?皮查伊表示,谷歌所有的工作都圍繞生成式AI模型Gemini來做。

      由此,多模態大模型 成為巨頭選定的未來方向,這讓人不由的發出疑問,中國大模型誰能扛起多模態的大旗?

      多模態遙遙領先的中國大模型

      谷歌發布會固然精彩,但總體上也談不上絕對領先,比如我們看到一個挺有意思的演示,就是給出一個三天的膳食計劃,最后得出的結果是圖文并茂的。這一點確實帶來了很大的體驗提升,而目前國內的大部分大模型的對話方式還是簡單的停留在文字交互上,多模態的混合內容幾乎沒有。

      不過比起國內的多模態AI搜索領軍產品天工大模型(www.tiangong.cn)來說,谷歌這個多模態的搜索結果就有點花拳繡腿了,比如我提的一個問題是“特斯拉與小米的參數對比”,這里給出的答案應該是所有大模型里唯一能夠用表格對比并配圖的了,在實用性和可用性上來說,真的是遙遙領先,根本不需要二次處理數據就可以直接輸出內容了。

      從這個角度來看的話,我覺得谷歌還是處于一個炫技的demo階段,而天工大模型在多模態這塊確實已經進入了一個實用階段。

      從這里我們可以看出,早在4月17日發布的“天工3.0”在多模態領域的領先并不僅僅是在國內范圍,而是全球范圍。“天工3.0”是采用4千億級參數MoE混合專家模型,也是全球模型參數最大、性能最強的MoE模型之一。

      最為重要的一點則是,“天工3.0”也是全球首個多模態“超級模型”(Super Model),其最早集成了AI搜索、AI PPT、AI視頻轉繪、AI寫作、AI長文本閱讀、AI對話、AI語音合成、AI圖片生成、AI漫畫創作、AI圖片識別、AI音樂生成、AI代碼寫作、AI表格生成等多項能力。

      這一路徑選擇,在一個月之后的今天,兩大巨頭的模型更新后,也被確認為全球大模型未來的發展方向。

      之所以天工能夠實現這樣的領先,是因為早在去年9月就發布了多模態大模型Skywork-MM然后一步一步迭代而來,這種對未來發展方向的遠見和正確判斷,無疑是在AI這種創新領域實現領先的關鍵。

      反觀谷歌反而在摸索方向方面耗費了太多的時間,現在才開始逐漸步入正軌。

      多模態AI打破個人創作局限

      如果說AI搜索是剛需的入口,那么多模態顯然就是應用的未來。我曾向很多公務員朋友推薦使用天工AI,其中很多多模態功能在工作中都有很好的表現。比如說AI ppt功能可以一鍵生成大綱和PPT,大幅降低工作的繁瑣程度,只要簡單修改就可以直接應用。

      而AI視頻轉繪畫的功能則是我意想不到的一個受歡迎的功能,因為大家都要做短視頻,但又不方便露臉,一鍵轉成漫畫風格就完全沒有問題了。

      對于文案工作者來說,閱讀分析大量的材料和進行范式文體的寫作是日常工作中最耗費精力的部分,而AI能夠帶來的最大價值就在這里了。

      天工的AI文檔解析支持無字數限制的文檔閱讀,除了PDF和TXT、EXCEL等文檔形式外也支持網絡鏈接,文檔上傳后,能一鍵生成AI摘要和要點提煉,還貼心標注提煉內容的總計字數及閱讀時間,方便參考。

      而且AI閱讀的所有問答歷史、閱讀列表都將成為你的個人知識庫,避免重復學習,也能隨時找到過去的工作成果。

      然后再配合AI寫作、AI PPT,可以快速生成大綱、框架、文本或者PPT,大幅提升文字工作的效率。這就是AI輔助未來辦公的一個真實可用的場景。

      值得一提到是,天工AI解析EXCEL這種復雜數據場景也是游刃有余,絕對是未來的硬核生產力工具。

      文字工作是一切的基礎,AI圖片、AI音樂、AI漫畫、AI代碼、AI數據分析等一系列AI多模態能力的誕生,則實現了全場景的生產效率提升,無論是我們想配一個無版權的插圖,還是想配一個合適的音樂,漫畫,現在都可以通過AI來生成完全具有知識產權的內容,這一點不僅僅會為職場人士帶來效率提升的價值,也會為大量的內容創業者打開創作的桎梏,生成更多的優質內容。

      從這一點來說,多模態的未來相關于每一個生產內容的人,也勢必會為創造力插上最強的輔助翅膀。

      除此之外,天工垂直領域的智能體對話的工具性也非常有實用價值,比如旅游在出行前問一問,就可以作出很好的推薦和路線規劃。

      星座運勢也可以隨時給出關于星座的運勢走向和生活指南,也可以給枯燥的生活帶來幾分樂趣和期待。

      這里尤其需要說明的是,能夠提供即時的信息內容,且視覺感不輸傳統搜索引擎的體驗,也是天工大模型的獨家能力,如果是其他大模型,大部分都只能呈現文字效果,甚至還在分析過去的信息,是沒有辦法提供星座運程這樣的即時的信息分析反饋的。

      還有很多年輕的朋友會在二次元漫畫中樂此不疲的完成自己的作品創作。而隨著多模態能力的發展,我相信還會有更多垂直領域的垂直模型被開發出來,這些對于人們的工作生活都會帶來顛覆性的改變。

      而最完美的場景自然是和語音助手的結合,讓每個人都能擁有一個類似鋼鐵俠的賈維斯那樣的AI助手,這樣大量的工作和娛樂需求只要一句話就會被AI滿足,這種完美的生活體驗我相信距離我們已經不遠了。

      AI搜索的開創者

      值得一提的是,除了在多模態方面的領先,天工也是中國AI搜索的開創者,2023年8月就率先推出基于自研大語言模型的AI搜索產品——天工AI搜索,這也啟發了國內的搜索巨頭,百度和360也相繼入局。

      目前來看,搜索融入AI可以說是一個神來之筆,從全球范圍來看,谷歌最終也很有可能憑借搜索的優勢來反超OpenAI。

      因為搜索和AI的結合是最為自然的,也是實用性提升最強的,它大大降低了搜索工具的使用門檻,同時篩掉了很多往往需要專業人士才能分辨的垃圾信息,而最終產生的搜索結果,就好像上面的對比表格一樣,直接利用率非常高,不再需要人們進行更復雜的二次數據整理和編輯。

      在這里需要強調的是,天工大模型和其他AI搜索的領先之處還有一點是支持簡潔、增強、研究3個模式,其中的簡潔模式的結果和其他大模型類似,而增強和研究兩個模式則能輸出更為豐富和復雜的結果來供更加專業的需求使用。

      比如關于普通人有必要理財么這個問題,簡潔模式就回復了基本的理財的目的、好處、風險,而增強版搜索則更為細節的闡述了理財的目的、理財的策略甚至還有理財的產品推薦。

      而在研究模式下,我們就可以看到指定理財計劃的推薦,以及10種理財工具的介紹,真的對這個領域有興趣的用戶就可以針對這10種產品進一步的進行研究和采納了。這三個答案可以說是比較充分的體現出了天工AI搜索三種模式結果的不同。

      對我本人的使用場景來說,大大解決了搜索中專業度不足的問題。之前我使用的大模型提供的素材很難在專業的稿件中用到,但天工AI搜索的增強尤其是研究模式下的結果,可用度就非常高了。

      當然天工在AI搜索方面的領先也不是憑空而來,很多人只知道天工的研發者昆侖萬維是國內市值數百億的上市公司,但不知道的是,它之前曾收購并成功運營海外主流瀏覽器Opera,所以在搜索方面不僅有很強的技術積累,同時也奠定了如今自研搜索引擎的能力,這種積累最終在AI領域實現了爆發,不能不說昆侖萬維在戰略和遠見方面的優勢。

      要知道,在國內同時具有大模型和搜索能力的公司屈指可數,而從目前的發展趨勢來看,這兩種能力的齊備是最后還能留在一線的必要條件。

      昆侖萬維在研發人員方面也是國內的第一梯隊,相較于國內幾個創業團隊百十人的規模,有數倍的優勢。而且這些研發人員質量也非常高,海內外知名院校博士就超過百人,其他大部分也都來自于微軟、阿里、百度這樣的行業大廠,技術水準有更好的保障。

      AI發展如火如荼,這其中不僅僅需要技術能力的支撐,也需要對未來發展方向的準確判斷和精準投入。畢竟AI發展就像滾雪球,好處是越來越大,領先優勢也越來越明顯,后來者很難追上。壞處就是一旦方向錯了,很容易尾大不掉,難以轉向。

      從目前的發展趨勢來看,多模態的方向已經相當確定,而天工在海內外的領先優勢也比較明顯。接下來就是要拉開差距和分勝負的時刻了。期待更強大的產品出現,也期待AI改變世界早日到來。

      申請創業報道,分享創業好點子。點擊此處,共同探討創業新機遇!

      相關標簽
      谷歌
      大模型

      相關文章

      • 歷時400多天,國產大模型全面趕超GPT-4?

        趕超GPT-4的階段性升級,可以看作是國產大模型有序迭代部署、不斷拉近差距的標志,切莫像手機跑分那樣,在過度營銷的作用下,淪為被群嘲的對象。

        標簽:
        大模型
      • 大模型爭霸的下一站:不僅是超越GPT-4,更是尋求模型之間的平衡應用

        文|智能相對論作者|沈浪知名科學雜志《Nature》發表了一篇關于大模型規模參數大小爭議的文章《InAl,isbiggeralwaysbetter?》——AI大模型,越大越好嗎?隨著大模型應用走向實踐,這一問題不可避免地成為了當前AI行業發展的焦點與爭議。有人認為,大模型當然是越大越好,參數越大,性

        標簽:
        大模型
      • 解密Kimi:大模型應用當紅頂流是如何練成的?

        拋開營銷戰,或許在中國也可以探索新的大模型應用聚合方式、供給方式以及商業利潤分配的方式,對大模型公司來說,這將是一個新議題。

        標簽:
        大模型
      • 大模型的現在進行時:走出對話框,走向產業端

        大模型熱潮涌動了一年多后,越來越多人平復了激動的情緒,開始從客觀的視角重新思考大模型的價值和機會。紅杉資本在AlAscent2024的開場演講中提到,大模型的創造能力和推理能力,第一次實現了以類似人類的方式進行交互,將支撐起數十萬億美元的市場。然而和AGI的遙遠夢想相比,大模型的創業者們卻不得不正視

        標簽:
        大模型
      • 李彥宏放話:百度AI大模型絕不搶開發者飯碗

        關注盧松松,會經常給你分享一些我的經驗和觀點。昨晚,李彥宏內部講話稱:AI大模型開源意義不大,百度絕不搶開發者飯碗。但你一定要說話算話哦,可千萬別說:“我永遠不做手機,誰再敢提做手機就給我走人”,結果5年后自己的手機銷量排名第一。如果百度也這么干的話估計AI也沒人用了。李彥宏認為:從商業模式的角度來

        標簽:
        大模型
      • 生產力工具中的“六邊形戰士”:解密海螺AI“紅海突圍”的底氣

        2023年可以說是人工智能行業最振奮的一年,大模型的能力每隔一段時間就會上一個新臺階,洶涌澎湃的技術革命迅速影響著每一個人的生活,AGI不再是一種技術理想,而是觸手可及的現實。到了2024年,人工智能的熱度不減,但口口相傳的“百模大戰”并未上演。資本市場罕見地“降溫”,不少大模型悄無聲息地消失,有機

      • 谷歌發布多模態大模型重回領先,中國大模型誰能一戰

        多模態是AI大模型發展的未來方向。

        標簽:
        谷歌
        大模型
      • 大模型“黑洞”能否逆襲成盈利“金礦”?揭秘未來走向!

        ChatGPT運行日耗70萬美金!GPT-4訓練成本破10億美金大關!OpenAI2024年財務警鐘敲響,破產風險浮現!國產大模型燒錢大戰升級!百度、科大訊飛、阿里、騰訊等巨頭已燒掉上百億資金!大模型背后的“燒錢”豪賭,誰能笑到最后?降低成本大模型成本怎么降低?有兩條比較實用的路徑大模型背后的成本確

      • 百度文心智能體有什么用、怎么創建和如何使用?

        前言:這是白楊SEO公號原創第530篇。為什么寫這個?一個星期多前在白楊流量匯群看到有人問,自己實戰測試研究了下分享給大家,也許對大家有點用。本文大綱:1、百度智能體是什么?2、百度智能體有什么用?3、百度智能體怎么創建?4、百度智能體如何用(營銷)?百度智能體是什么?百度智能體,準確的叫法應該是百

        標簽:
        百度文心

      編輯推薦