数据结构与算法

组件分享之后端组件——超轻量级的工作流引擎go-workflow

组件分享之后端组件——超轻量级的工作流引擎go-workflow 背景 近期正在探索前端、后端、系统端各类常用组件与工具,对其一些常见的组件进行再次整理一下,形成标准化组件专题,后续该专题将包含各类语言中的一些常用组件。欢迎大家进行持续关注。 组件基本信息 组件:go-workflow 内容 本节我们分享一个超轻量级的工作流引擎go-workflow,基本架构同Activiti工作流有些相似

LSM Tree 数据库底层索引

数据库中非常常用的索引数据结构——B+ 树,在过去很多年里它都是数据库索引的首选实现方式,但是这种数据结构也并不是很完美。因为,每次修改数据都很有可能破坏 B+ 树的约束,我们需要对整棵树进行递归的合并、分裂等调整操作,而不同节点在磁盘上的位置很可能并不是连续的,这就导致我们需要不断地做随机写入的操作,而随机写入的性能是比较差的,这个问题在写多读少的场景下会更加明显。 LSM Tree(Log S

【读书笔记】《 Hadoop构建数据仓库实践》第1章

02-《 Hadoop构建数据仓库实践》.jpg 第1章 数据仓库简介 1.1 什么是数据仓库 Inmon将数据仓库描述为一个面向主题的、集成的、随时间变化的、非易失的数据集合,用于支持管理者的决策过程。 1.3 数据仓库架构 1.3.2 主要数据仓库架构 在数据仓库技术演化过程中,产生了几种主要的架构方法,包括数据集市架构、Inmon企业信息工厂架构、Kimball数据仓库架构和混合

K 值选对,准确率翻倍:KNN 算法调参的黄金法则

目录 一、背景介绍二、KNN 算法原理2.1 核心思想2.2 距离度量方法2.3 算法流程2.4算法结构:三、KNN 算法代码实现3.1 基于 Scikit-learn 的简单实现3.2 手动实现 KNN(自定义代码)四、K 值选择与可视化分析4.1 K 值对分类结果的影响4.2 交叉验证选择最优 K 值五、KNN 算法的优缺点与优化5.1 优点5.2 缺

Apache Doris——物化视图

八、物化视图 物化视图就是包含了查询结果的数据库对象,可能是对远程数据的本地copy,也可能是一个表或多表join后结果的行或列的子集,也可能是聚合后的结果。说白了,就是预先存储查询结果的一种数据库对象。 在Doris中的物化视图,就是查询结果预先存储起来的特殊的表。 物化视图的出现主要是为了满足用户,既能对原始明细数据的任意维度分析,也能快速的对固定维度进行分析查询。 适用场景 1、分析需求覆

红包分配算法的严格数学理论与完整实现

目录 理论框架与数学基础 红包分配算法分类与建模 核心算法数学证明 算法实现与优化 性能分析与复杂度理论 公平性度量与统计检验 高级优化技术 实际应用与工程实现 1. 理论框架与数学基础 1.1 问题形式化定义红包分配问题可以严格定义为: 定义 1.1(红包分配问题): 给定总金额 M>0M > 0M>0 和参与人数 n∈N+

【算法通关指南:数据结构与算法篇】破局二叉树!特殊结构 + 双重存储 + 遍历算法,一文吃透所有核心

🔥小龙报:个人主页 🎬作者简介:C++研发,嵌入式,机器人方向学习者 ❄️个人专栏:《算法通关指南》 ✨ 永远相信美好的事情即将发生 文章目录 前言 一、二叉树的概念 1.1 二叉树的定义 1.2 特殊的二叉树 1.2.1 满二叉树 1.2.2 完全二叉树

思维与算法共舞:AIGC语言模型的艺术与科学

 云边有个稻草人-个人主页 热门文章_云边有个稻草人的博客-本篇文章所属专栏~ 目录引言:AIGC与文本生成概述一、AIGC基础:语言模型的基本原理1. 什么是语言模型?2. 预训练与微调二、AIGC的应用领域:文本生成的具体应用1. 内容创作2. 客户服务与聊天机器人3. 自动摘要4. 翻译与语言转换三、前沿突破:

【推荐系统】推荐召回算法(一):双塔召回模型训练与推理(Dual Tower Model and Faiss Retrieval)

目录一、引言二、双塔模型(Dual Tower Model,双塔模型 )2.1 双塔模型——离线训练2.2 双塔模型——在线推理(Faiss检索库应用)2.3 双塔模型——优缺点2.3.1 优点2.3.2 缺点2.4 业务代码实践2.4.1 模型代码实现2.4.2 模型训练与推理测试2.4.3 打印模型结构 三、总结一、引言前几