大豆油 - 簡書

大豆油

ChatGPT 介紹

ChatGPT 核心思想雖然我們難以用規(guī)則刻畫怎樣的回答才算“沒有偏見、基于客觀事實、對用戶有幫助”，但我們?nèi)祟惸軌驅(qū)懗鲞@樣的回答，也能夠判斷兩條回答中哪一條更優(yōu)砸烦。因此我...

23 0 0

大豆油

強化學習4-PPO算法

策略梯度算法假設一條馬爾科夫軌跡為，那么該軌跡發(fā)生的概率為：不考慮折扣衰減，該軌跡獲得的收益為累計回報：由于馬爾科夫鏈是采樣得到的雳灵，因此當前策略可獲得的期望獎勵為： ...

43 0 0

大豆油

OCR 文本識別綜述

1. 移動端的優(yōu)勢與難點移動端OCR有兩種做法，一種是在移動端本地進行 OCR 識別闸盔，只能對背景簡單的印刷體文字取得較好的效果悯辙，比如名片識別，證件識別等都有成熟的商業(yè) SD...

64 0 0

大豆油

UIE 論文閱讀

1. UIE 介紹信息抽扔场（IE）是一個從文本到結(jié)構(gòu)的轉(zhuǎn)換過程躲撰。常見的實體、關系击费、事件分別采取Span拢蛋、Triplet、Record形式的異構(gòu)結(jié)構(gòu)蔫巩。具體表現(xiàn)為生成式統(tǒng)一建模...

53 0 0

大豆油

推薦系統(tǒng)-深度模型

Wide&Deep 網(wǎng)絡推薦系統(tǒng)的主要挑戰(zhàn)之一瓤狐，是同時解決 Memorization 和 Generalization。Wide & Deep 模型的核心思想是結(jié)合線性模型...

27 0 0

大豆油

FM 模型理論基礎

1. 背景介紹假設一個廣告分類的問題批幌，根據(jù)用戶和廣告位相關的特征缘挽，預測用戶是否點擊了廣告湿酸。數(shù)據(jù)如下： clicked?CountryDayAd_type1USA26/11/...

29 0 0

大豆油

Stable Diffusion模型基礎

一接剩、數(shù)學基礎 1. 正態(tài)分布標準化對于一個服從高斯分布的隨機變量枣氧，計算其均值和標準差〗卮郑“標準正態(tài)分布”信姓，就是取鸵隧、正態(tài)分布給出的，其概率密度函數(shù)為：對于任意一個正太分布的概...

40 0 0

大豆油

Agent介紹

發(fā)展脈絡 Prompt 工程通過描述角色技能意推、任務關鍵詞豆瘫、任務目標及任務背景菊值，告知大模型需要輸出的格式，并調(diào)用大模型進行輸出昵宇。如角色扮演（如摘要助手儿子、翻譯官等）、少樣本提示...

56 0 0

大豆油

強化學習基礎知識詳解

強化學習（Reinforcement Learning）強化學習基本概念強化學習四要素：狀態(tài)(state)、動作(action)儡毕、策略（policy）扑媚、獎勵(reward...

xbo

38491 2 22

大豆油

GPT-1,GPT-2,GPT-3三兄弟

前段時間大火的工具Github Copilot想必大家都略有耳聞，我們只需要輸入一些注釋說明你需要的函數(shù)功能附井，AI就會自動幫你編寫完整的函數(shù)代碼两残，代碼邏輯人弓、規(guī)范甚至比自己寫的...

乘瓠散人

7042 1 3

大豆油

GRPC以及python實現(xiàn)

GRPC簡介 A high-performance, open-source universal RPC framework --官網(wǎng) RPC(remote procedur...

臻甄

5049 2 5

大豆油

推薦系統(tǒng)遇上深度學習(七)--NFM模型理論和實踐

推薦系統(tǒng)遇上深度學習系列：推薦系統(tǒng)遇上深度學習(一)--FM模型理論和實踐：http://www.reibang.com/p/152ae633fb00推薦系統(tǒng)遇上深度學習(...

文哥的學習日記

22940 4 19

大豆油

推薦系統(tǒng)理論(三) -- 冷啟動問題

本章的思維導圖如下： 1锥咸、冷啟動問題簡介如何在沒有大量用戶數(shù)據(jù)的情況下設計個性化推薦系統(tǒng)并且讓用戶對推薦結(jié)果滿意從而愿意使用推薦系統(tǒng)细移，就是冷啟動的問題。冷啟動問題主要分為...

文哥的學習日記

5088 0 15 1

大豆油

推薦系統(tǒng)遇上深度學習(六)--PNN模型理論和實踐

推薦系統(tǒng)遇上深度學習系列：推薦系統(tǒng)遇上深度學習(一)--FM模型理論和實踐：http://www.reibang.com/p/152ae633fb00推薦系統(tǒng)遇上深度學習(...

文哥的學習日記

26215 3 24

大豆油

推薦系統(tǒng)遇上深度學習(一)--FM模型理論和實踐

1原茅、FM背景在計算廣告和推薦系統(tǒng)中，CTR預估(click-through rate)是非常重要的一個環(huán)節(jié)擂橘，判斷一個商品的是否進行推薦需要根據(jù)CTR預估的點擊率來進行摩骨。在進...

文哥的學習日記

86773 34 144

大豆油

gitlab 導入并同步github 的項目

把github上的開源項目備份成gitlab的私有項目灾馒。然后把github上的代碼更新到本地，最后推送到gitlab私有庫。這樣就可以保證gitlab和github的代碼一樣...

else05

11604 1 7

大豆油

阿里近幾年公開的推薦領域算法有許多，既有傳統(tǒng)領域的探索如MLR算法蒿褂，還有深度學習領域的探索如entire -space multi-task model，Deep Inter...

文哥的學習日記

30905 10 32

大豆油

秋招常見面試問題總結(jié)

1堪旧、常見的機器學習優(yōu)化器 1.1 gradient descent 1.1.1 全量梯度下降(Batch gradient descent)每次使用全量的訓練集樣本來更新模型...

文哥的學習日記

6085 6 32