人工智能

AI提示词宝典:100+常用提示词,覆盖20+场景,程序员和小白必备,让AI工作更高效!

你是不是也有过这样的经历:打开 AI 工具(ChatGPT、文心一言、豆包等),盯着输入框半天,却只打出 “帮我写点东西”“给点建议”,最后得到的回复要么空泛、要么偏离需求?其实,AI 的 “智商” 很大程度上取决于你的 “提问方式”——提示词(Prompt)

Hadoop-MapReduce运行机制

    MapRduce是hadoop中的一个分布式计算工具,分为map阶段和reduce阶段其采用了一个分而治之的思想      以下一个例子作为演示,假设有一个涉及300M的文件(1.txt200m 2.txt 100m) 进行计算,求每个单词所占的个数 image.png mapreduce_流程.png Map阶段 image.png 1.首先进行逻辑

模糊的记忆——脑的本质

这部分是以进化论为前提的,如果你不相信进化论,信服力可能会打折扣。但是,为了了解本章的内容,信不信的问题暂且搁置。 因为人脑有很多与维持生命没有直接关系的高级能力,这些能力会掩盖脑的本质,为了研究脑的本质,本章研究了动物脑,动物脑的大部分能力与维持生命有直接关系。这里研究的是狗脑。 狗是一种非常聪明的动物,可以学会很多复杂的指令。通过研究狗脑可以探索脑的本质。下面的实验使用美食来激励狗子。 实验是

大数据数仓经典最值得阅读书籍推荐

从事数仓工作,在工作学习过程也看了很多数据仓库方面的数据,此处整理了数仓中经典的,或者值得阅读的书籍,推荐给大家一下,希望能帮助到大家。建议收藏起来,后续有新的书籍清单会更新到这里。 书籍推荐 《数据仓库工具箱(第3版)——维度建模权威指南》 数据仓库工具箱 本书会介绍基本知识,然后逐个讨论具体实例内容,最后进行综合总体分析,在内容的结构方面很有特色。本书涉及的行业较多,但这些内容

021练习

import java.util.List; import java.util.stream.Stream; public class NoneMathchDemo { public static void main(String[] args) { List<Employee> list = Employee.getEmpList(); // 获取公共类的测试数据 St

树+神经网络算法强强联手(Python)

结合论文《Revisiting Deep Learning Models for Tabular Data》的观点,集成树模型通常擅长于表格数据这种异构数据集,是实打实的表格数据王者。集成树模型中的LightGBM是增强版的GBDT,支持了分类变量,在工程层面大大提高了训练效率。关于树模型的介绍,可见之前文章:一文讲透树模型 DNN深度神经网络擅长于同构的高维数据,从高维稀疏的表

2025 AI数据准备:EasyLink让多模态非结构化数据处理变简单

一、前言在数据驱动的时代,企业每天被PDF、财报、合同、研究报告等海量文档所淹没。这些非结构化的多模态数据中蕴藏着关键业务洞察,却因格式复杂、版式多样、信息分散,成为难以开采的暗数据。研究人员仍需逐页翻查论文,分析师依旧通宵解析百页报表——传统处理方式不仅效率低下,更在规模面前显得无力。随着大模型的普及,许多人期待

数据仓库(06)数仓分层设计

  目前主流的数据仓库分层大多为四层,也有五层的架构,这里介绍基本的四层架构。 分别为数据贴源层(ods)、数据仓库明细层(dw)、多维明细层(dws)和数据集市层(dm)。   下面是架构图: 数据仓库分层设计   数据分层的目的是:减少重复计算,避免烟囱式开发,节省计算资源,靠上层次,越对应用友好,也对用户友好,希望大部分(80%以上)的需求,都用DWS,DW的表来支持就行,所以

纳米AI超级智能体,保姆级入门教程(文末送邀请码)

官网下载客户端打开网页纳米AI下载客户端。打开客户端,选择智能体。万能工具案例广场旅行规划智能体已经集成了高德地图 mcp、网页生成。MCP 免费工具箱采集小红书笔记 AI新闻智能播报助手除了直接使用现有工具,纳米AI还允许用户创建个性化智能体。作为经常需要研究各类AI技术的博主,我尝试创建了一个专属的"早报播音员",让他帮我

统计学习方法1.4-2.1 笔记

1.4 模型评估与模型选择 训练误差与测试误差 关于模型的拟合好坏,计算训练集的训练误差进行衡量。 关于模型预测的好坏,通过测试集衡量 计算预测和真实的差异:测试误差:衡量预测效果 训练误差: 所有样本来自训练集,模型对于已知数据的预测能力。 测试误差: 样本来自测试集。模型对于未知数据的预测能力。 误差率和准确率是测试误差的两个特例 误差率里,当