MaXiaoTiao
Always like this.
Home
Archives
Categories
Label
Moments
Photos
Link
About
学习
默认分类
随笔
学习
生活
旅行
工作
模型的知识冲突现象
在大语言模型(LLM)的世界里,知识不是储存在一个线性的书架上,而是弥散在亿万个参数之间,像一张看不见的神经网络星图。它不像人类那样“记得”一件事,而是“统计地倾向于”某种表达。当你问它一个问题,它会从这张星图中沿着概率最高的路径走出来,告诉你它“认为”最可能的答案。 一、什么是大模型的知识冲突 “
学习
2025-07-03
稀疏向量 vs 稠密向量:到底有什么区别?
稀疏向量 vs 稠密向量:到底有什么区别? 我们常听到“稀疏向量”和“稠密向量”这两个词,它们到底差在哪?一句话概括: 稀疏 vs 稠密,说白了就是信息在向量中的分布方式不同。 一、最直观的区别 稀疏向量(Sparse Vector):大多数维度都是 0,只有少量非零元素。 稠密向量(Dense V
学习
2025-07-02
Text2sql 框架
Text2sql 框架 一个完整的 文本到 SQL(Text-to-SQL)任务框架 应该包括四个关键步骤:预处理、抽取、生成、精炼。 预处理(Preprocessing) 该阶段主要处理与自然语言查询(NLQ)无关但对 SQL 生成至关重要的辅助信息,包括: 数据库模式信息(Schema Info
学习
2025-04-03
Text2Sql相关论文及code
Text2Sql 以下是一些关于Text-to-SQL的相关论文及其代码仓库: OpenSearch-SQL:一个开源的Text-to-SQL框架,提供了将自然语言查询转换为SQL查询的功能。 GitHub链接:OpenSearch-AI/OpenSearch-SQL CHASE-SQL:该框架利用
学习
2025-04-02
「解构大模型:HuggingFace 下载背后的秘密」
在当今大模型飞速发展的时代,HuggingFace 已成为 AI 研究者和开发者不可或缺的重要平台。这里不仅汇聚了各种开源的大模型,还有丰富的数据集,为 AI 研究和应用提供了极大的便利。 当我们从 HuggingFace 下载一个模型时,仿佛迎接了一位多才多艺的伙伴。这个“伙伴”带着一整套文件,每
学习
2025-03-26
Text2SQL 的 难点(或者说关键点)
Text2SQL 的 难点(或者说关键点) 1.如何让复杂的多表查询Sql拆解 在用户的日常提问中,约70% 的查询,一句SQL是没办法直接搞定的(除非直接一张大宽表),很多时候,我们需要将其分解为多个sql进行执行。 例如用户提问“查询上海地区前三的客户过去三年复购率”,实际需要拆
学习
2025-03-24
Ollama常见命令
📌 安装 Ollama curl -fsSL https://ollama.com/install.sh | sh 或参考 Ollama 官网 下载安装。 🚀 模型管理 1. 查看已下载的模型 ollama list 例如: ollama pull mistral
学习
2025-02-10
1B模型和1T数据要训练多久
1B模型和1T数据要训练多久 1. 训练时间计算公式 训练时间的计算公式如下: $\frac{abc
学习
2025-01-22
手撕Multi-head Attention
手撕Multi-head Attention
学习
2025-01-21
Docker Compose
Docker Compose 是一个用于定义和运行多容器 Docker 应用程序的工具。通过一个 YAML 文件(通常命名为 docker-compose.yml),你可以配置应用程序所需的多个服务、网络和卷,并使用一条命令启动所有服务。 主要功能 多容器管理:简化多容器应用的配置和启动。 YAML
学习
2025-01-15
下一页