酷酷的群 - 簡書

酷酷的群

0
關注
928
粉絲
129
文章
299206

字數(shù)
1824

收獲喜歡
96

總資產(chǎn)

IP屬地：浙江

酷酷的群

直接偏好優(yōu)化技術(shù)DPO基礎理論及推導
論文標題：Direct Preference Optimization: Your Language Model is Secretly a Reward Model論文鏈接...

544 0 1
酷酷的群

自適應視圖增強的謠言檢測圖對比學習方法
論文標題：Propagation Tree Is Not Deep: Adaptive Graph Contrastive Learning Approach for Rum...

156 0 0

酷酷的群

生成式大模型的RLHF技術(shù)（一）：基礎
一、概述大語言模型（LLMs）在預訓練的過程中通常會捕捉數(shù)據(jù)的特征，而這些訓練數(shù)據(jù)通常既包含高質(zhì)量的也包含低質(zhì)量的忆某，因此模型有時會產(chǎn)生不被期望的行為，如編造事實浦箱，生成有偏見...

826 0 1
酷酷的群

LoRA：大模型下游任務的低秩適應
論文標題：LoRA: Low-Rank Adaptation of Large Language Models論文鏈接：https://arxiv.org/abs/2106....

685 0 1
酷酷的群

Megatron-LM：Transformer模型專用分布式張量模型并行方法
論文標題：Megatron-LM: Training Multi-Billion Parameter Language Models Using Model Parallel...

513 0 1
酷酷的群

思維樹：大模型的復雜推理技術(shù)
論文標題：Tree of Thoughts: Deliberate Problem Solving with Large Language Models論文鏈接：https:...

659 0 1
酷酷的群

LIMA：小規(guī)模監(jiān)督數(shù)據(jù)指令微調(diào)
論文標題：LIMA: Less Is More for Alignment論文鏈接：https://arxiv.org/abs/2305.11206[https://arxi...

276 0 1

酷酷的群

語言模型的自洽性思維鏈推理技術(shù)
論文標題：Self-Consistency Improves Chain of Thought Reasoning in Language Models論文鏈接：https:...

347 0 1
酷酷的群

GPipe：微批量流水線并行
論文標題：GPipe: Easy Scaling with Micro-Batch Pipeline Parallelism論文鏈接：https://arxiv.org/ab...

305 0 2
酷酷的群

InstructGPT：語言模型的人類反饋指令對齊
論文標題：Training language models to follow instructions with human feedback論文鏈接：https://ar...

557 0 2
酷酷的群

高效底座模型LLaMA
論文標題：LLaMA: Open and Efficient Foundation Language Models論文鏈接：https://arxiv.org/abs/230...

385 0 1
酷酷的群

TokenGT：Transformer是強大的圖學習器
論文標題：Pure Transformers are Powerful Graph Learners論文鏈接：https://arxiv.org/abs/2207.02505...

455 0 1

酷酷的群

思維鏈Prompting促進大型語言模型的推理能力
論文標題：Chain-of-Thought Prompting Elicits Reasoning in Large Language Models論文鏈接：https://...

1487 0 2
酷酷的群

GPT-3：大語言模型小樣本學習
論文標題：Language Models are Few-Shot Learners論文鏈接：https://arxiv.org/abs/2005.14165[https:/...

620 0 2
酷酷的群

GPT-2：無監(jiān)督多任務學習語言模型
論文標題：Language Models are Unsupervised Multitask Learners論文鏈接：https://d4mucfpksywv.cloud...

443 0 2
酷酷的群

GPT：通用預訓練語言模型
論文標題：Improving Language Understanding by Generative Pre-Training論文鏈接：https://www.cs.ubc...

469 0 2

簡書創(chuàng)作者

暫無個人介紹

亚洲A日韩AV无卡,小受高潮白浆痉挛av免费观看,成人AV无码久久久久不卡网站,国产AV日韩精品