
LLM相关技术名词备忘
蒸馏 简单理解为从其他模型如Qwen 7B中提取知识来训练自己,旨在减小模型大小,提供更高效的推理能力。 LLM LLM(Large Language Model )大语言模型 量化 在深度学习中,模型的权重和激活值通常使用高精度的浮点数表...
蒸馏 简单理解为从其他模型如Qwen 7B中提取知识来训练自己,旨在减小模型大小,提供更高效的推理能力。 LLM LLM(Large Language Model )大语言模型 量化 在深度学习中,模型的权重和激活值通常使用高精度的浮点数表...
一、前言 话不多说,先上一张图,我想大家已经懂了,谁现在工作中没经历过这样的痛苦呢?一个产品文档几百上千页,找些想要的信息可谓大海捞针,关键字匹配一下匹配到65535个结果……(wdnmd) 什么是RAG? RAG(...
一、DS 介绍 DeepSeek是一家大模型初创公司,全称“杭州深度求索人工智能基础技术研究有限公司”,因2025年1月份发布并直接开源的DeepSeek-R1及V3模型被大众所熟知,此模型由中国团队自主研发,参数高达670亿,性能对标 O...
一、DS 介绍 DeepSeek是一家大模型初创公司,全称“杭州深度求索人工智能基础技术研究有限公司”,因2025年1月份发布并直接开源的DeepSeek-R1及V3模型被大众所熟知,此模型由中国团队自主研发,参数高达670亿,性能对标 O...