人工智能

大数据数仓经典最值得阅读书籍推荐

从事数仓工作,在工作学习过程也看了很多数据仓库方面的数据,此处整理了数仓中经典的,或者值得阅读的书籍,推荐给大家一下,希望能帮助到大家。建议收藏起来,后续有新的书籍清单会更新到这里。 书籍推荐 《数据仓库工具箱(第3版)——维度建模权威指南》 数据仓库工具箱 本书会介绍基本知识,然后逐个讨论具体实例内容,最后进行综合总体分析,在内容的结构方面很有特色。本书涉及的行业较多,但这些内容

数据仓库(06)数仓分层设计

  目前主流的数据仓库分层大多为四层,也有五层的架构,这里介绍基本的四层架构。 分别为数据贴源层(ods)、数据仓库明细层(dw)、多维明细层(dws)和数据集市层(dm)。   下面是架构图: 数据仓库分层设计   数据分层的目的是:减少重复计算,避免烟囱式开发,节省计算资源,靠上层次,越对应用友好,也对用户友好,希望大部分(80%以上)的需求,都用DWS,DW的表来支持就行,所以

纳米AI超级智能体,保姆级入门教程(文末送邀请码)

官网下载客户端打开网页纳米AI下载客户端。打开客户端,选择智能体。万能工具案例广场旅行规划智能体已经集成了高德地图 mcp、网页生成。MCP 免费工具箱采集小红书笔记 AI新闻智能播报助手除了直接使用现有工具,纳米AI还允许用户创建个性化智能体。作为经常需要研究各类AI技术的博主,我尝试创建了一个专属的"早报播音员",让他帮我

华为云Flexus+DeepSeek征文|深度解析华为云:企业级云计算服务的全面评测:安装博查插件-搭建模态AI搜索

前引: 在全球领先的技术企业中,云计算已成为企业提升竞争力的关键基础设施,华为云凭借其深厚的技术积累和创新能力,正在重塑企业云计算服务的新生态。本文将全面深入地评测华为云的服务特性、技术优势、性能表现和市场定位,为企业选择云服务提供专业、客观的参考,华为云正在用技术创新重塑云计算服务标准,为企业

CHATERM AI:开启云资源氛围管理新篇章!

合合信息近日正式发布开源项目——云资源智能管理终端Chaterm,这是一款AI AGENT终端工具,旨在通过自然语言的终端交互,增强开发者的工作效率。与OpenAI Codex等本地CLI不同的是,合合信息Chaterm工具可以通过SSH连接,批量管理远端的服务器,甚至大规模的线上集群。这使得开发者可以轻松地管理数

在Golang中配置Logrus

当你开始使用Golang编写应用程序时,记录应用程序的运行状态和错误信息是至关重要的。为了记录这些信息,你需要使用一个强大的日志库。Logrus是一个流行的日志库,它提供了丰富的功能和易于使用的API。 在本文中,我们将介绍如何配置Logrus来记录应用程序的日志信息。 安装Logrus 首先,你需要在你的应用程序中安装Logrus。在终端中运行以下命令: go get github

树+神经网络算法强强联手(Python)

结合论文《Revisiting Deep Learning Models for Tabular Data》的观点,集成树模型通常擅长于表格数据这种异构数据集,是实打实的表格数据王者。集成树模型中的LightGBM是增强版的GBDT,支持了分类变量,在工程层面大大提高了训练效率。关于树模型的介绍,可见之前文章:一文讲透树模型 DNN深度神经网络擅长于同构的高维数据,从高维稀疏的表

统计学习方法1.4-2.1 笔记

1.4 模型评估与模型选择 训练误差与测试误差 关于模型的拟合好坏,计算训练集的训练误差进行衡量。 关于模型预测的好坏,通过测试集衡量 计算预测和真实的差异:测试误差:衡量预测效果 训练误差: 所有样本来自训练集,模型对于已知数据的预测能力。 测试误差: 样本来自测试集。模型对于未知数据的预测能力。 误差率和准确率是测试误差的两个特例 误差率里,当