頭條
AI 引發(fā)了一場(chǎng)網(wǎng)絡(luò)爬蟲(chóng)之戰(zhàn)
https://spectrum.ieee.org/web-crawling
數(shù)據(jù)來(lái)源倡議的一份報(bào)告警告說(shuō)零截,隨著網(wǎng)站越來(lái)越多地限制爬蟲(chóng)機(jī)器人衙耕,阻止訪問(wèn)高質(zhì)量數(shù)據(jù),生成式 AI 模型可能會(huì)受到影響。這種趨勢(shì)是由對(duì)數(shù)據(jù)濫用的擔(dān)憂推動(dòng)的,可能會(huì)將 AI 訓(xùn)練的依賴從維護(hù)良好的來(lái)源轉(zhuǎn)移到質(zhì)量較低的數(shù)據(jù)。在數(shù)據(jù)日益稀缺的情況下,公司可能會(huì)轉(zhuǎn)向合成數(shù)據(jù)或直接許可夹囚,以保持 AI 模型的有效性。
Anthropic Quickstart Repo
https://github.com/anthropics/anthropic-quickstarts/
Anthropic 發(fā)布了一組有用的入門項(xiàng)目邀窃。它與 Brex荸哟、Uber、Facebook 等公司的前 AI 負(fù)責(zé)人合作瞬捕,幫助編寫了第一個(gè) Quickstart鞍历,這是一個(gè)由 Claude 提供支持的可擴(kuò)展客戶服務(wù)代理。
OpenAI Japan 首席執(zhí)行官透露 GPT Next 計(jì)劃
https://www.itmedia.co.jp/aiplus/articles/2409/03/news165.html
OpenAI 的 GPT Next 將以大約 100 倍于 GPT-4 的計(jì)算負(fù)載進(jìn)行訓(xùn)練肪虎。它將于今年晚些時(shí)候發(fā)布劣砍。真實(shí)的估計(jì)表明,一些計(jì)算負(fù)載的變化也是由于算法的改進(jìn)笋轨。
研究
成功實(shí)現(xiàn) AI 安全需要哪些條件
https://sleepinyourhat.github.io/checklist/
Anthropic 的 Sam 猜測(cè)秆剪,在開(kāi)發(fā)超人 AI 系統(tǒng)的過(guò)程中赊淑,開(kāi)發(fā)人員需要完成哪些任務(wù)才能成功實(shí)現(xiàn) AI 安全爵政。
擴(kuò)展 Vision Mamba 模型
https://arxiv.org/abs/2408.17081v1
本文介紹了一種隨機(jī)分層混洗正則化技術(shù),以克服 Vision Mamba 模型中的過(guò)度擬合問(wèn)題陶缺,使其能夠擴(kuò)展到 3 億個(gè)參數(shù)钾挟,同時(shí)保持與 Vision Transformers (ViT) 相當(dāng)?shù)男阅堋?/p>
增強(qiáng)細(xì)粒度場(chǎng)景理解
https://arxiv.org/abs/2405.05852v1
研究人員已經(jīng)開(kāi)發(fā)出穩(wěn)定的控制表示,以改進(jìn)具身 AI 代理中的細(xì)粒度場(chǎng)景理解饱岸。通過(guò)使用預(yù)先訓(xùn)練的文本到圖像擴(kuò)散模型掺出,這些表示可以捕獲復(fù)雜任務(wù)所需的詳細(xì)視覺(jué)空間信息徽千。
工程
H100 市場(chǎng)缺失的指南
本指南涵蓋了 GPU 購(gòu)買的基本方面,包括不同選項(xiàng)的定價(jià)汤锨、確彼椋可靠性、其他硬件規(guī)格的重要性以及可用性考慮因素闲礼。它解決了買家在 GPU 市場(chǎng)中面臨的關(guān)鍵問(wèn)題牍汹,從成本到性能和物流。
穩(wěn)定的視覺(jué)里程計(jì)
https://github.com/shuyanguni/drl_exposure_ctrl
該項(xiàng)目提供了一個(gè)深度強(qiáng)化學(xué)習(xí)框架柬泽,以提高視覺(jué)里程計(jì) (VO) 系統(tǒng)在具有挑戰(zhàn)性的照明條件下的穩(wěn)定性慎菲。
檢測(cè)罕見(jiàn)心臟異常
https://github.com/mediabrain-sjtu/ecgad
一種先進(jìn)的心電圖診斷系統(tǒng),使用自監(jiān)督異常檢測(cè)預(yù)訓(xùn)練來(lái)提高對(duì)罕見(jiàn)但關(guān)鍵的心臟異常的檢測(cè)能力锨并。
雜七雜八
Reliant 的論文搜索 AI 承擔(dān)了科學(xué)數(shù)據(jù)繁瑣的工作
https://techcrunch.com/2024/08/20/reliant-ai/
Reliant AI 由 Karl Moritz Hermann 共同創(chuàng)立露该,已獲得 1130 萬(wàn)美元的種子輪融資,旨在通過(guò)其 AI 產(chǎn)品 Tabular 實(shí)現(xiàn)學(xué)術(shù)界耗時(shí)的文獻(xiàn)綜述自動(dòng)化第煮,該產(chǎn)品可從科學(xué)出版物中零錯(cuò)誤地提取數(shù)據(jù)解幼。利用 LLM 和專有技術(shù),Reliant 為研究人員提供了用戶友好的用戶界面包警,比傳統(tǒng)方法提高了效率书幕。其內(nèi)部硬件方法強(qiáng)調(diào)了對(duì)研究行業(yè)高質(zhì)量、特定領(lǐng)域的 AI 解決方案的承諾揽趾。
前線工程師協(xié)會(huì)
人工智能工程是推動(dòng)人工智能技術(shù)發(fā)展的核心台汇,尤其強(qiáng)調(diào)道德發(fā)展和負(fù)責(zé)任的實(shí)施。意大利 C3i 等專業(yè)協(xié)會(huì)通過(guò)持續(xù)培訓(xùn)和道德準(zhǔn)則來(lái)保持質(zhì)量標(biāo)準(zhǔn)并支持工程師篱瞎。不斷發(fā)展的領(lǐng)域要求工程師不斷更新技能苟呐、創(chuàng)新和跨學(xué)科合作,以負(fù)責(zé)任地充分利用人工智能的全部潛力俐筋。
利用人工智能實(shí)現(xiàn)高效的事件響應(yīng)
Meta 推出了一種使用啟發(fā)式檢索和基于 LLM 的排名的人工智能輔助根本原因分析系統(tǒng)牵素,在其網(wǎng)絡(luò) monorepo 調(diào)查中,準(zhǔn)確率達(dá)到 42%澄者。根據(jù)歷史數(shù)據(jù)對(duì) Llama 2 模型進(jìn)行微調(diào)是提高系統(tǒng)準(zhǔn)確性的關(guān)鍵笆呆。該公司計(jì)劃擴(kuò)大人工智能工具集成,旨在實(shí)現(xiàn)主動(dòng)風(fēng)險(xiǎn)緩解和自主工作流程粱挡。
Windows 11 上的 RWKV
https://threadreaderapp.com/thread/1831000938120917336.html
出色的 RWKV 模型已在其 cpp 項(xiàng)目中包含本地推理模型知纷。
編程的藝術(shù)以及我為什么不使用LLMs
https://kennethnym.com/blog/why-i-still-wont-use-llm/
LLMs越來(lái)越多地融入到編碼工作流程中紊选,因提高生產(chǎn)率而受到稱贊,但有些人認(rèn)為它們?cè)诰幊讨械挠行员豢浯罅恕?/p>
人工智能以前所未有的準(zhǔn)確度預(yù)測(cè)地震
https://scitechdaily.com/artificial-intelligence-predicts-earthquakes-with-unprecedented-accuracy
德克薩斯大學(xué)的研究人員開(kāi)發(fā)了一種人工智能,在中國(guó)的一次試驗(yàn)中預(yù)測(cè)了 70% 的地震权谁。