人工智能

clickhouse-HDFS

参考文档 前言 在hdfs格式ck能解析的情况下,比如CSV,TSV等,可以在ck中建立一个映射表。读取hdfs中的数据,使用ck来分析。需要注意的是如果uri路径中包括了Globs模糊匹配符号,那么说明ck只是映射hdfs中的文件,是只读的。如果写入会

建模论文组成部分

一、题目 避免指代不清、表达不明。加入论文的模型或计算方式。 二、摘要 1、要解决什么问题?问题的目标是什么?2、通过怎样的思路,建立什么模型解决问题?3、结果是什么? 注意在论文完成后再写摘要!!! 三、正文 1、提出问题,2、分析问题,3、选择模型,4、建立模型,5、得出结论。 提出问题和分析问题要简短。选择和建立模型要目标明确,数据详实,公式合理,计算精确。 内容尽量使用科学符号表达,结合图

【WGCNA学习笔记】两次相关性分析

纸上得来终觉浅,绝知此事要躬行 学习要明确输入输出,多举例子,多找到应用场景,多进行检索练习——费曼学习法 之前总感觉WGCNA已经学习的差不多了,已经能够实际使用了,结果时间一长,就会把这个技能给生疏了,所以,记录下学习的过程,有助于自己的认识深入。 学习金字塔 WGCNA的两次相关性分析 第一次相关性分析 WGCNA第一次实际上是把众多的基因进行了一个归类,将具有

数据迁移工具DataX入门

一、DataX是什么 DataX是阿里巴巴开源的离线数据同步工具,实现了包括主流RDBMS数据库、NoSQL、大数据计算系统在内的多种异构数据源之间高效进行数据同步的功能。 二、为什么要使用DataX DataX设计理念 为了解决异构数据源的同步问题,DataX将复杂的网状同步链路优化成了星型数据链路,由DataX作为中间传输载体来负责连接各种数据源,以此来降低整个异构数据源同步链路的

【Coze-AI智能体平台】3 步给 AI “植入长期记忆”!Coze 数据库创建 + 数据导入 + 复用教程

🔥小龙报:个人主页 🎬作者简介:C++研发,嵌入式,机器人方向学习者 ❄️个人专栏:《coze智能体开发平台》 ✨ 永远相信美好的事情即将发生 前言 在AI技术全面渗透生活与工作的今天,Coze正以「零门槛智能搭建工具」的姿态脱颖而出。它打破了传统AI应

解析Apache BookKeeper

本系列关于 BookKeeper 的博客希望帮助大家理解和掌握 BookKeeper 原理和内部逻辑。理解系统内部运行逻辑是快速定位并解决生产问题以及开发和修改新功能的基石。在本系列后续文章中,我会将BookKeeper各项指标与运行机制相结合,为大家展现高效进行性能问题定位的方法。 BookKeeper 中包含很多不同的插件,我们主要关注 BookKeeper 作为 Apache Pulsar

基于 Rokid AI Glasses 灵珠「随身导游·景点讲解助手」智能体开发全过程

本文围绕旅行场景痛点,详细记录了基于Rokid AI Glasses与灵珠智能体开发「随身导游·景点讲解助手」的完整过程,核心介绍了产品构想、智能体搭建(含名称、类别、功能配置)、入参与模型选择(采用doubao-seed-1-6-vision-250815视觉模型)、人设与回复逻辑编排(四大技能模

BI技巧丨同环比计算

我们在做BI报表分析的时候,大部分指标的运算逻辑都不是特别的复杂,很多用户对于指标最基本的需求,就是可以展示当月数据,看个同环比,能看个YTD就够了。 需求听上去并不是特别的复杂,但是这里面也是有一些小技巧的。 先来看看本期的案例数据: 案例数据就一张Sales的销售事实表,表结构也相对简单,将其导入到PowerBI中。 添加如下日期表,并建立模型关系。

最大熵原理及代码

一.最大熵原理 最大熵的思想很朴素,即将已知事实以外的未知部分看做“等可能”的,而熵是描述“等可能”大小很合适的量化指标,熵的公式如下: 这里分布的取值有种情况,每种情况的概率为,下图绘制了二值随机变量的熵: p=np.linspace(0.1,0.9,90) def entropy(p): return -np.log(p)*p-np.log(1-p)*(1-p) plt.plot