学习

一、构建知识图谱(实体识别)

一、构建知识图谱(实体识别) 实体识别(Entity Recognition),也称为命名实体识别(Named Entity Recognition, NER),是知识图谱构建过程中的关键步骤之一。它的目的是从非结构化文本中识别出具有特定意义或指代性强的实体,如人名、地名、组织名、时间表达式等。以下
2024-05-01

在问答系统中知识图谱的应用

在问答系统中知识图谱的应用 在问答系统中使用知识图谱可以提高系统的回答准确性和丰富度。以下是使用知识图谱构建问答系统的一般步骤: 1. 知识图谱构建 在问答系统之前,首先需要构建知识图谱。这包括以下几个步骤: 数据收集:从各种数据源(如书籍、文章、数据库等)收集信息。 实体识别:从文本中识别出关键实
2024-04-30

语义匹配问题

语义匹配问题 对向量知识库中的相关内容与相关实体进行语义匹配 难点:如何准确计算用户输入的和知识库相关内容语义相似度。 解决方案: 使用嵌入技术(如Word2Vec, BERT,m3e等)将文本转换为向量表示,然后计算向量之间的相似度。 应用余弦相似度、欧几里得距离或更复杂的相似度度量方法,如基于深
2024-04-19

BERT 模型

BERT 模型 BERT 模型可以作为公认的里程碑式的模型,但是它最大的优点不是创新,而是集大成者,并且这个集大成者有了各项突破,下面让我们看看 BERT 是怎么集大成者的。 BERT 的意义在于:从大量无标记数据集中训练得到的深度模型,可以显著提高各项自然语言处理任务的准确率。 近年来优秀预训练语
2024-04-02

Nginx面试相关

1. Nginx 的工作原理是什么? 面试官意图:考察你对 Nginx 核心机制的理解。 回答要点: Nginx 采用事件驱动和异步非阻塞的模型,能够高效处理高并发请求。 它使用一个主进程(Master Process)和多个工作进程(Worker Process),主进程负责管理,工作进程负责处理
2024-04-02

GPT 模型

GPT 模型 GPT 模型的预训练 在讲解 ELMo 的时候,我们说到 ELMo 这一类预训练的方法被称为 “Feature-based Pre-Training”。并且如果把 ELMo 这种预训练方法和图像领域的预训练方法对比,发现两者模式看上去还是有很大差异的。 除了以 ELMo 为代表的这种基
2024-04-01

chatGLM的模型架构

chatGLM的模型架构
2024-04-01

将项目部署在Docker中

将项目部署在Docker中 1. 准备你的项目 确保你的项目能够在本地正常运行。通常,你需要一个 requirements.txt 文件(对于 Python 项目)或者其他语言的依赖文件,以及一个入口脚本或命令。 2. 编写 Dockerfile 创建一个 Dockerfile 在项目的根目录下。这
2024-03-22

GIT常用命令

GIT常用命令 命令 分类 功能说明 clone 获取代码
2024-03-13

RAG的一个坑之相似度不准

RAG的一个坑之相似度不准 Embedding相似度不准 问题: 希望命中的,往往不是相似度最高的那个匹配出来的结果,有时候预期中最LLM 生成的时候,都有 token上限 为了不超过上限,需要对匹配结果安照相似度选前 K个匹配结果 最终希望命中的那一个,没有成功进入入到LLM Prompt 里 解
2024-03-07