BLUE

ACarxiv-cs-cl.bsky.socialOct 2, 2024 2:32am

Shaolin Zhu, Leiyu Pan, Bo Li, Deyi Xiong LANDeRMT: Detecting and Routing Language-Aware Neurons for Selectively Finetuning LLMs to Machine Translation https://arxiv.org/abs/2409.19523

Tt6aguirre.bsky.socialSep 29, 2024 11:34pm

o projeto de lei focava especialmente em modelos grandes (custo acima de 100 milhão de doláres de treinamento ou 10 mi de finetuning) e riscos catastróficos (mais de meio bilhão de doláres de danos e/ou mass casualties)

ACarxiv-cs-cv.bsky.socialSep 28, 2024 3:01am

Qihan Huang, Siming Fu, Jinlong Liu, Hao Jiang, Yipeng Yu, Jie Song Resolving Multi-Condition Confusion for Finetuning-Free Personalized Image Generation https://arxiv.org/abs/2409.17920

ACarxiv-cs-cl.bsky.socialSep 27, 2024 6:01am

Chr-Jr Chiu, Chung-Chi Chen, Hen-Hsen Huang, Hsin-Hsi Chen Pre-Finetuning with Impact Duration Awareness for Stock Movement Prediction https://arxiv.org/abs/2409.17419

ACarxiv-cs-cl.bsky.socialSep 25, 2024 7:32am

Vatsal Raina, Adian Liusie, Mark Gales Finetuning LLMs for Comparative Assessment Tasks https://arxiv.org/abs/2409.15979

ACarxiv-cs-cl.bsky.socialSep 24, 2024 4:30pm

Chenxu Yang, Ruipeng Jia, Naibin Gu, Zheng Lin, Siyuan Chen, Chao Pang, Weichong Yin, Yu Sun, Hua Wu, Weiping Wang Orthogonal Finetuning for Direct Preference Optimization https://arxiv.org/abs/2409.14836

ACalecrimi.bsky.socialSep 24, 2024 9:36am

Here it is how you can do #finetuning #RaspberryPI youtube.com/watch?v=DTYi...#TinyLLaMA #TinyDolphin #Ollama #AIonEdge #MachineLearning #AIModels #EdgeComputing #AI #LLM

Aadverb.bsky.socialSep 23, 2024 12:07am

Definitely makes sense that if you don't/can't tune the LLM, you probably won't get better few-shot results than directly finetuning a model like Roberta (given you're in the mid-sized-or-greater data regime).

Aanonn1.bsky.socialSep 19, 2024 6:55pm

6/14 🔍 How does OML1.0 work? It starts with training (finetuning) a model on a unique set of secret (key, response) pairs so that whenever a key is input into a model, the output will contain the response.

Aanonn1.bsky.socialSep 19, 2024 5:34pm