[项目详解][boost搜索引擎#1] 概述 | 去标签 | 数据清洗 | scp
目录一、前言二、项目的相关背景三、搜索引擎的宏观原理四、搜索引擎技术栈和项目环境五、正排索引 VS 倒排索引--原理正排索引分词倒排索引六、编写数据去除标签和数据清洗模块 Parser1.数据准备parser编码1.枚举文件 EnumFile2.去标签ParseHtml()测试使用SCP命令在两台Linux服务器之间传输文件适用场景命令格式示例将scp任务放入后台执行Boost搜索引擎项目的九个步