搜索

【项目日记(二)】搜索引擎-索引制作

❣博主主页: 33的博客❣ ▶️文章专栏分类:项目日记◀️ 🚚我的代码仓库: 33的代码仓库🚚 🫵🫵🫵关注我带你了解更多项目内容 目录 1.前言 2.索引结构 2.1创捷索引 2.2根据索引查询 2.3新增文档 2.4内存索引保存到磁盘 2.5把磁盘索引加载到内存 3.性能优化 3.1多

.gitattributes与git lfs

.gitattributes.gitattributes 是 Git 项目的一个配置文件,用来定义文件在 Git 中的行为。它可以控制 Git 如何处理特定类型的文件,比如合并策略、换行符、文本编码、diff 显示方式、LFS(Git Large File Storage)等内容。🌟 用通俗点的话来说:.git

一文详解ESLint+Prettier+Husky配置

ESLint+Prettier1. 引入 ESLint ESLint 是 JavaScript 和 TypeScript 项目的标准代码检查工具。安装 ESLintnpm install eslint --save-dev初始化配置运行以下命令,按照提示生成 .eslintrc 文件:npx eslint --init选择项目类型(JavaScri

如何操作 Elasticsearch 进行文档的更新和删除?

Elasticsearch 的文档更新和删除操作需结合其 分片机制、版本控制、近实时特性 实现。以下为详细操作指南,涵盖基础操作与高阶实践: 一、核心操作原则 不可变文档机制 ES 不会原地修改文档,而是 替换旧文档(删除后重新索引) 所有更新实质是 GET->修改->PUT 过程 版本号控制 每次变更版

Git 分支本地和远程删除方法详解

Git 分支本地和远程删除方法详解 技术背景在使用 Git 进行版本控制的过程中,我们会创建多个分支来进行不同功能的开发、测试和修复。当某个分支的任务完成后,为了保持仓库的整洁和清晰,我们需要删除不再使用的分支。这就涉及到如何正确地删除本地分支和远程分支。 实现步骤 删除本地分支要删除本地分支,可以使用以下命令: git b

[项目详解][boost搜索引擎#1] 概述 | 去标签 | 数据清洗 | scp

目录一、前言二、项目的相关背景三、搜索引擎的宏观原理四、搜索引擎技术栈和项目环境五、正排索引 VS 倒排索引--原理正排索引分词倒排索引六、编写数据去除标签和数据清洗模块 Parser1.数据准备parser编码1.枚举文件 EnumFile2.去标签ParseHtml()测试使用SCP命令在两台Linux服务器之间传输文件适用场景命令格式示例将scp任务放入后台执行Boost搜索引擎项目的九个步

Elasticsearch权威指南:深入理解function_score查询

Elasticsearch权威指南:深入理解function_score查询什么是function_score查询function_score查询是Elasticsearch中用于精细控制文档评分(_score)的强大工具。它允许开发者在原始查询评分的基础上,通过应用各种数学函数来调整或完全替换评分结果。这种机制特别适用于需要将多种因素综合考虑的复杂搜索场景。为什么需要

从关键词匹配到语义理解——电商搜索引擎的智能化改造实战

unsetunset1、问题来源unsetunset 做电商平台搜索优化,遇到一个典型问题:用户搜索"性价比高的手机",系统只能匹配标题包含"性价比"的商品,那些真正物美价廉但描述不同的产品完全检索不到。更离谱的是搜索"送女朋友的礼物",系统直接懵了。 核心问题是中文表达的