所有語言
分享
95后女生創立的AI視頻生成工具Pika Labs在上周刷屏,4人團隊,成立半年就獲得5500萬美元融資,估值2億美元。同時也在A股上演了“父憑女貴”的戲碼,其父親所在的上市公司在這款工具爆火后連續收穫3個漲停。國內首套完全用 AIGC 設計的漢服成衣亮相第十七屆杭州文博會,AIGC在影視行業有了用武之地。導演藉助無界 AI,可以很直觀地生成自己想要的東西,給到需要溝通的部門,大大節省了溝通成本。
生成式 AI 初創公司 Together AI 獲超 1 億美元 A 輪融資
據 AIGC 開放社區報道,11 月 30 日,開源生成式 AI 平台 Together AI 在官網宣布,獲得 1.025 億美元(約 7.3 億元)A 輪融資。本次由凱鵬華盈(Kleiner Perkins)領投,英偉達、Emergence Capital、NEA、Prosperity 7、Greycroft 等跟投。
生成式 AI 初創公司 Pika Labs 完成 5500 萬美元融資,並推出視頻生成器 Pika 1.0
據 The Decoder 11 月 29 日報道,生成式 AI 初創公司 Pika Labs 在由 Nat Friedman 和 Daniel Gross 領投的前種子輪和種子輪融資以及由 Lightspeed Venture Partners 領投的 A 輪融資中籌集了 5500 萬美元。其他投資者包括 Adam D'Angelo(Quora 創始人兼首席執行官)、Andrej Karpathy、Clem Delangue(Hugging Face 聯合創始人兼首席執行官以及 Factorial Capital 合伙人)和 Craig Kallman(Atlantic Records 首席執行官)。
此外,Pika Labs 宣布推出視頻生成器 Pika 1.0。據悉,Pika 1.0 採用了全新的人工智能模型,可以生成和編輯三維動畫、動漫、卡通和電影等不同風格的視頻。
AI 生成工具 HeyGen 完成 560 萬美元融資
AI 新智界訊,11 月 29 日,AI 生成工具 HeyGen 在社交平台 X 上宣布,獲得 560 萬美元的新風險投資,由 SarahGuo 的 Conviction Partners 領投。該公司本輪融資估值為 7500 萬美元。此外,HeyGen 表示,其 ARR(年度經常性收入)已在一年內從 100 萬美元增長到 1800 萬美元,並推出 Instant Avatar(Avatar 2.0)。
生物技術和 AI 初創公司 Cradle 獲 2400 萬美元 A 輪融資
據 TechCrunch 11 月 28 日報道,繼去年完成 550 萬美元的種子輪融資后,生物技術和人工智能初創公司 Cradle 獲得 2400 萬美元 A 輪融資,此前投資者 Index Ventures 領投,Kindred Capital(也是種子輪投資者)以及 Chris Gibson、Tom Glocer 等個人投資者參投,新資金將用於發展團隊和銷售。
“海納 AI”完成數千萬元 A 輪融資,聯想創投獨家投資
據 36 氪 12 月 1 日報道,“海納 AI”近日完成數千萬元 A 輪融資,由聯想創投獨家投資,本輪融資資金將用於人才招募、AI 模型研發、營銷體系搭建。據了解,“海納 AI”是北京群星閃耀科技有限公司旗下的人才招聘垂直領域 AI 產品,最早於 2019 年推出,專攻 AI 面試服務,幫助企業藉助 AI 技術完成招聘面試環節。
哈爾濱工業大學(深圳)發布多模態大模型“九天”
據站長之家 12 月 4 日報道,哈爾濱工業大學(深圳)近期發布了名為九天(JiuTian-LION)的多模態大語言模型,通過融合細粒度空間感知和高層語義視覺知識,取得了在 13 個視覺語言任務上的 state-of-the-art 性能,尤其在 Visual Spatial Reasoning 任務上實現了 5% 的性能提升。
智源研究院正式開源 700 億參數大模型 Aquila2-70B-Expr
據 36 氪 11 月 30 日報道,北京智源人工智能研究院副院長兼總工程師林詠華在 2023 人工智能計算大會上宣布,正式開源 700 億參數大模型 Aquila2-70B-Expr(異構先驅版),這是首個基於英偉達混合資源及天數智芯混合資源完成訓練的大模型。
據介紹,此次基於 FlagScale v0.2 分別在英偉達混合資源(A100 集群 + A800 集群)、天數智芯混合資源(BI-V100 集群 + BI-V150 集群)完成了 Aquila2-70B-Expr 大模型訓練工作。
浪潮信息發布千億級開源大模型“源 2.0”
據鈦媒體 11 月 27 日報道,浪潮信息正式發布千億級開源大模型“源 2.0”。源 2.0 採用 LFA(Localized Filtering-based Attention)局部依賴的自注意力機制,可有效捕捉局部信息和短序列信息,使得模型能夠更精準地掌握上下文之間的強語義關聯,學習人類語言習慣範式和編程能力。
復旦保險團隊發布“保險智酷”保險領域專用大模型
據《科創板日報》12 月 2 日報道,復旦保險紅人節暨“保險智酷”大模型發布會召開,由復旦保險團隊研發的保險垂直大模型“保險智酷”在會上發布。據介紹,“保險智酷”是為保險場景下的各類用戶提供專業、智能、全面的数字化服務的保險領域專用大語言模型。
阿里雲開源通義千問 720 億參數模型
據金十 12 月 1 日消息,阿里雲開源通義千問 720 億參數模型 Qwen-72B、18 億參數模型 Qwen-1.8B 及音頻大模型 Qwen-Audio。據悉,阿里雲本次開源的模型中除預訓練模型外,還同步推出了對應的對話模型,面向 72B、1.8B 對話模型提供了 4bit/8bit 量化版模型,便於開發者們推理訓練。
騰訊、南洋理工等開源圖表羊駝大模型 ChartLlama
據機器之心消息,近期,騰訊聯合南洋理工大學、東南大學提出了 ChartLlama。研究團隊創建了一個高質量圖表數據集,並訓練了一個專註於圖表理解和生成任務的多模態大型語言模型。ChartLlama 結合了語言處理與圖表生成等多重性能,為科研工作者和相關專業人員提供了一個強大的研究工具。
幻方量化旗下 DeepSeek 發布 67B 大模型
AI 新智界訊,11 月 29 日,知名私募巨頭幻方量化官方宣布,其探索 AGI(通用人工智能)的新組織“深度求索(DeepSeek)”繼 11 月初發布 Coder 代碼模型之後,正式發布通用大語言模型“DeepSeek LLM 67B”。模型已完全開源,同時服務已經全面開放內測。
DeepSeek 稱,相比開源的同級別模型 LLaMA2 70B,DeepSeek LLM 67B 在近 20 个中英文的公開評測榜單上表現更佳,尤其突出的是推理、數學、編程等能力。
Stability AI 推出 Stable Diffusion XL Turbo 模型
據 IT 之家 11 月 30 日報道,Stability AI 日前推出了 Stable Diffusion XL Turbo(SDXL Turbo),為此前 SDXL 模型的改進版本,號稱採用了“對抗性擴散蒸餾技術(Adversarial Diffusion Distillation)”,將圖片生成迭代步驟從原先的 50 步減少至 1 步,據稱“僅僅進行一次迭代步驟就能生成高品質圖像”。
據悉,Stable Diffusion XL Turbo 模型的最大特點,就是上述“一次迭代生成圖像”,號稱可以進行“即時文字轉圖像輸出”,並能夠保證圖片的質量。實驗結果显示,Stable Diffusion XL Turbo 在大幅降低運算需求的同時,仍可以保持良好的圖像生成品質,該模型單詞迭代,即勝過 4 次迭代的 LCM-XL,而 4 次迭代的 Stable Diffusion XL Turbo 就可擊敗此前經過 50 步迭代配置的 Stable Diffusion XL;在 A100 GPU 上,計算 512 x512 分辨率的圖像,只需 207 毫秒。
谷歌發布 Translatotron 3 模型,可繞過文本轉換步驟
據 IT 之家消息,谷歌正式介紹推出了名為 Translatotron 3 的新 AI 模型,無需任何并行語音數據下,可以實現語音對語音的同聲傳譯翻譯。
谷歌於 2019 年推出了 Translatotron S2 ST 系統,於 2021 年 7 月推出第 2 個版本,在 2023 年 5 月 27 日發布的一篇論文中,宣布正在部署新方法,訓練 Translatotron 3。研究人員稱,Translatotron 2 已經提供了卓越的翻譯質量、語音魯棒性(Robust)和語音自然度,而 Translatotron 3 實現“第一個完全無監督直接語音到語音翻譯的端對端模型”。
亞馬遜推出多項 AI 工具,包括 Titan 系列 AI 模型等
據 VentureBeat 11 月 30 日報道,繼推出名為 Amazon Q 的新型聊天機器人,升級款 AI 系統處理器 Trainium2,並與英偉達拓展夥伴關係外,亞馬遜 AWS 數據與人工智能副總裁 Swami Sivasubramanian 昨日在 re: Invent 大會上又公布了一系列新的 AI 工具。其中包括三款“Titan”系列生成式 AI 模型:Titan Image Generator、Titan Text Express 和 Titan Text Lite。此外,Amazon Bedrock 也迎來升級,可為企業客戶提供了對市面上大多數模型的訪問權限,包括 AI21 的 Jurassic、Anthropic 的 Claude 2.1、Meta 的 Llama 2 和 Stable Diffusion。
國內首套完全用 AIGC 設計的漢服成衣亮相第十七屆杭州文博會
AI 新智界訊,11 月 23 日至 27 日,第十七屆杭州文化創意產業博覽會在杭州成功舉辦。在此期間,國內首套完全用 AIGC 設計創作的漢服成衣在展會上亮相。這件漢服的設計源自 2023 年“夢溪杯”宋韻文化創新大賽的優秀作品《飾韻西子》,由參賽者李超使用無界 AI 創作完成。該作品的靈感來自四種中國傳統配色——鞠衣、楊妃、青蓮、翠微,並由無界 AI 和宋韻漢服大模型搭配工筆人物、勾線水彩等 LORA 創作而成。
字節跳動在海外上線大模型產品“ChitChop”
據 Tech 星球 11 月 29 日報道,字節在海外上線了一款名為“ChitChop”的大模型產品,開發運營公司是 POLIGON,字節旗下海外社交產品 Helo 同樣由該公司運營,目前已上線獨立 App 和網頁版。
據悉,ChitChop 是一個人工智能助理工具,可以為用戶提供多達 200 + 的智能機器人服務,通過提供創造性靈感、提高工作效率等方式來服務用戶的工作和生活。值得注意的是,這款產品與抖音集團旗下 AI 產品“小悟空”類似,都是基於雲雀大語言模型創建的 AI 工具合集。
魅族發布大模型 Aicy AI,支持問答、繪畫等多項 AI 功能
據快科技 11 月 30 日報道,魅族今日官宣發布 Flyme 10.5 系統和自家大模型 Aicy AI。據介紹,Aicy AI 是即問即答的百科全書,擁有海量知識的 Aicy 能回答自然科學、生活知識、健康常識、情感問答等各類問題。另外,Aicy 還支持創意靈感生成畫作,可以生成寫實風、二次元、水墨風等各種風格的畫作。此外,圖庫還新增了 AI 寫真功能。用戶上傳照片后,AI 就能生成其寫真照片。
谷歌 DeepMind 利用 AI 工具 GNoME 發現 220 萬種新晶體材料
AI 新智界訊,11 月 30 日,谷歌 DeepMind 在《自然》期刊上展示了 AI 工具 GNoME,並介紹了 AI 在材料科學上的相關應用。據悉,DeepMind 使用 GNoME 發現了 220 萬種新晶體,其中有 38 萬種晶體屬於穩定材料,可以在實驗室製造,有望應用在電池或是超導體等方面。DeepMind 聲稱,如果僅憑藉人力計算出這些材料,需要花費 800 年。
阿里國際發布 3 款 AI 設計生態工具
據《科創板日報》12 月 1 日報道,在第六屆中國國際工業設計博覽會上,阿里國際發布了 3 款設計生態工具:堆友、PicCopilot、鹿班 AI。據介紹,這 3 款產品具有 AI 繪畫、AI 模型創作、AI 圖像和視頻處理等功能,目前已經服務數十萬商家、覆蓋 50 萬設計師。
Freepik 推出 Pikaso 實時 AI 繪圖工具 採用 LCM 繪圖技術,簡單線條即可成圖
據站長之家 12 月 1 日 消息,近日,知名圖庫平台 Freepik 發布了其創新產品——Pikaso 實時繪圖工具,結合 LCM 技術與百萬級圖庫,為用戶帶來了全新的創作體驗。Pikaso 採用前沿的 LCM 繪圖技術,結合 Freepik 的數百萬授權圖庫,使在線實時繪圖成為可能。
韓媒:三星 Galaxy Book 4 系列筆記本 12 月 15 日發布,將支持本地運行高斯 AI 大模型
據 IT之家援引韓聯社報道,有業內人士透露稱,三星电子將於本月 15 日推出搭載英特爾下一代處理器酷睿 Ultra 的 Galaxy Book 4 系列筆記本電腦,號稱是全球首款 AI 筆記本。
報道稱,Galaxy Book 4 相比上一代產品要提早一個半月亮相。這次之所以選擇更早發布,是因為三星需要體現這款新品作為“首款 AI 筆記本”的象徵意義。Galaxy Book 4 有望搭載其自研的 AI 大模型“高斯”(Samsung Gauss),設備無需將收集到的信息傳輸到中央服務器,這意味着該筆記本內置的“高斯”將支持本地運行。
華碩將發布首款英特爾酷睿 Ultra 處理器 AI 筆記本
AI 新智界訊,ASUS 華碩今日在微博上宣布,2024 華碩酷睿 Ultra AI PC 輕薄本新品發布會將在 12 月 15 日 15:00 舉行,屆時華碩靈耀系列筆記本新品也將登場。華碩稱,這是首台最新酷睿 Ultra 筆記本電腦。
比爾・蓋茨:生成式 AI 已達極限,下一個突破是可解釋 AI
據《科創板日報》11 月 27 日報道,比爾・蓋茨表示,OpenAI 內部包括奧特曼在內的很多人都相信 GPT-5 將明顯優於 GPT-4。但他認為,有很多理由相信,當前生成式人工智能已經達到極限。下一個突破蓋茨認為是可解釋 AI,但預計要到下一個十年(2030-2039)才能實現。
中國科學院院士徐宗本:大模型研究目前與科學化相去甚遠
據界面新聞報道,中國科學院院士徐宗本在 CCF 中國軟件大會上表示,大模型作為人工智能發展新浪潮的趨勢,對於科研範式、生產方式、工業模式的革命性影響不可低估,投入大模型研究已是必然選擇。但他同時表示,大模型研究目前仍屬於工程化,與科學化相去甚遠。
他認為,軟件將成為人工智能最先突破的領域,“軟件有語言,語言有語法,語法有嚴格的標準,人工智能只要能夠規範化、有邏輯邊界,就能在軟件領域做得好。”
Hugging Face 聯創發布 2024 年預測:開源 LLM 將達到最好的閉源 LLM 水平
AI 新智界訊,11 月 27 日,AI 開源社區 Hugging Face 聯合創始人兼首席執行官 Clement Delangue 發帖對 2024 年行業的發展做了 6 條預測,包括: 一家當紅 AI 公司會倒閉,或者以極低的價格被收購;開源 LLM 將達到最好的閉源 LLM 水平;AI 在視頻、時間序列、生物和化學領域取得重大突破; 大眾將更進一步關心 AI 在經濟上和環境上的成本; 某個流行媒體的大多數內容將由 AI 生成; Hugging Face 上 1000 萬人工智能開發者不會導致失業增加。
北京智源人工智能研究院林詠華:國內 AI 芯片的大模型訓練性能與國外約有三年差距
據《科創板日報》11 月 29 日報道,北京智源人工智能研究院副院長、總工程師林詠華表示,當前中國 AI 芯片的大模型集群訓練性能,只有個別接近英偉達 A100/A800,大多數不到 50%。此外是生態差距巨大,我國 AI 芯片公司有 40 余家,但中國 AI 芯片整體的市場佔有率加起來不超過 10%,各家 AI 芯片軟件各異、生態十分零碎割裂。
馬雲:AI 電商時代剛剛開始,對誰都是機會、也是挑戰
據《科創板日報》11 月 29 日報道,從多名阿里內部人士處了解到,針對員工對於昨晚拼多多財報和電商等的討論,馬雲在阿里內網罕見地參与了談論併發言。馬雲稱,請大家多提建設性意見和建議,特別是創新想法。他相信今天的阿里人大家都在看都在聽,更堅信阿里會變,阿里會改。所有偉大的公司都誕生在冬天里。AI 電商時代剛剛開始,對誰都是機會,也是挑戰。馬雲還說,要祝賀拼多多過去幾年的決策,執行和努力。“誰都牛過,但能為了明天後天牛而改革的人,並且願意付出任何代價和犧牲的組織才令人尊重。回到我們的使命和願景,阿里人,加油!”
Meta 首席科學家楊立昆駁黃仁勛:超智能不會很快到來
據 IT 之家 12 月 4 日報道,英偉達首席執行官黃仁勛不久前宣稱,超級人工智能(AI)將在五年內趕超人類。對此,Facebook 母公司 Meta 首席科學家、深度學習先驅楊立昆(Yann LeCun)的觀點截然相反。他認為,超智能不會很快到來。
楊立昆表示,目前的人工智能系統還需要幾十年的時間才能達到某種意義上的類人感知能力。屆時,這些具備常識的人工智能系統更加強大,不再僅僅限於以創造性的方式總結堆積如山的文本。對於黃仁勛的觀點,楊立昆評論道:“我了解黃仁勛,這位英偉達首席執行官從人工智能熱潮中獲益良多。這是一場人工智能戰爭,而它在提供武器。”
研究:GPT-4 在醫學問題上擊敗了專業調優的 MedPaLM 2 模型
據站長之家 12 月 4 日報道,微軟研究人員展示了 GPT-4 在醫學知識測試中的卓越表現,特別是當結合先進的提示工程技術時,其性能超過了專業調整的 MedPaLM2。
研究結果显示,相較於費時費力的調優和模型訓練,將更有效的提示工程應用於主流通用模型可能是實現更準確結果的更好途徑。Medprompt 方法採用了多種提示工程技術,包括 GPT-4 生成的思維鏈推理和生成多個單獨評分的回答,然後將最高分的答案返回給用戶。儘管這種方法會增加推理的成本,因為生成了更多的標記,但結果表明,將領先的通用模型(如 GPT-4)與高級提示工程技術相結合,以評估最新性能的標準,可能是值得考慮的。
研究稱:生成一張AI圖像所消耗能源相當於給手機充滿電
據站長之家 12 月 1 日 消息,根據 AI 初創公司 Hugging Face 和卡內基梅隆大學的研究人員進行的一項新研究,每次使用 AI 生成圖像、撰寫电子郵件或向聊天機器人提問,都會對地球造成一定的負擔。
實際上,使用強大的 AI 模型生成一張圖像所消耗的能源相當於給手機充滿電,該研究首次計算了使用 AI 模型進行不同任務所產生的碳排放。然而,他們發現使用 AI 模型生成文本的能源消耗明顯較低。生成1,000次文本只消耗相當於手機充電量的16% 的能源。