人工智能

「数据湖篇」一文带你深入理解数据湖

更多精彩好文,尽在微信公众号《大数据阶梯之路》 一、数据湖是什么 数据湖相当于一个汇集着来自各个异构数据源的原生态数据,不经过加工清洗数据,数据的格式也五花八门,结构化和半结构化和非结构化的数据都能够被数据湖管理起来。 那么就引申出数据湖的特点: 数据湖的存储能力极强,能容纳海量数据 数据湖中数据格式多,不止结构化数据,还能存储半结构化和非结构化数据 数据湖提供从异构数据源中提取数据和元数据

数据采集助力AI大模型训练

引言 使用抓取浏览器采集ebay商品页面 选购亮数据AI训练数据 总结 引言   AI技术在今天已经是我们工作生活中不可或缺的工具,很多小伙伴也在致力于训练AI模型。高质量的数据是训练强大AI模型的核心驱动力,无论是自然语言处理、计算机视觉还是推荐系统,数据的规模、多样性和准确性直接决定了模型的性能和泛化能力。然而,在实

Graphpad绘制ROC曲线

Graphpad绘制ROC曲线 接受者操作特性曲线(receiver operating characteristic curve,简称 ROC 曲线),又称为感受性曲线(sensitivity curve)。得此名的原因在于曲线上各点反映着相同的感受性,它们都是对同一信号刺激的反应,只不过是在几种不同的判定标准下所得的结果而已。接受者操作特性曲线就是以虚惊概率为横轴,击中概率为纵轴所组成的坐标图

医学图像分割的基准:TransUnet(用于医学图像分割的Transformer编码器)器官分割

1、 TransUnet 介绍TransUnet是一种用于医学图像分割的深度学习模型。它是基于Transformer模型的图像分割方法,由AI研究公司Hugging Face在2021年提出。医学图像分割是一项重要的任务,旨在将医学图像中的不同结构和区域分离出来,以便医生可以更好地诊断和治疗疾病。传统的医学图像分割方法通常使用基于卷积神经网络&#xff08

Trae IDE评测体验:通过 MCP Server - Figma AI Bridge 一键将 Figma 转为前端代码

Trae IDE评测体验:通过 MCP Server - Figma AI Bridge 一键将 Figma 转为前端代码在现代前端开发中,从设计稿到可用页面的交付往往需要大量重复劳动:切图、手写样式、布局调整……而借助 MCP Server - Figma AI Bridge,我们可以将 Figma 设计稿自动转换成整洁的 HTML/CS

华为云Flexus+DeepSeek征文 | 基于Dify和DeepSeek-R1开发企业级AI Agent全流程指南

作者简介我是摘星,一名专注于云计算和AI技术的开发者。本次通过华为云MaaS平台体验DeepSeek系列模型,将实际使用经验分享给大家,希望能帮助开发者快速掌握华为云AI服务的核心能力。 目录1. 前言2. 环境准备2.1 华为云资源准备2.1 实操手册3. 开发企业知识库Agent3.1 访问dify平台工作室3.2 导入工作流3.4 创建知识库3.4

AI 的智能体专栏:从原理到搭建,解锁 AI 自主系统技能

AI 的智能体专栏:从原理到搭建,解锁 AI 自主系统技能 AI 的智能体专栏:从原理到搭建,解锁 AI 自主系统技能,本文介绍 “AI 的智能体专栏”,围绕智能体展开,解析其自主运行原理,教读者用大模型搭建简单智能体及设计多智能体协作。学习该专栏可提升多方面能力,

产品经理眼中的数据仓库

作为一名数据产品经理,即使我们不写程序,也需要知道正在运行的大数据系统中,是如何一步步的实现可视化展示的。不仅能指导在新产品规划中提前基于典型业务场景、异常业务分析(如核心客户流失对年度营业收入的影响分析、某次线下活动过后出现一批从未出现过的新线索)、客户最为关心的经营指标波动等等的产品功能设计,也能在需求汇报或原型讲解时,以事实案例为依据、数据为支撑来提升可行性和上线后的成功概率。甚至在产品投入

时间平方根法、时间对数法笔记

规范求取固结系数的方法有时间平方根法和时间对数法,基本原理都是利用理论曲线和试验曲线的形状相似性,配合经验,找某一固结度下(时间平方根法选的是90%固结度,时间对数法选的是50%固结度)理论曲线上时间因数相当于试验曲线上的某一时间值。时间平方根法步骤如下:先根据试验数据绘制变形与时间平方根的关系曲线,然后找到曲线上初始阶段的直线段,延长交与纵轴,交点叫做理论零点,再过理论零点做一条直线,新直线是老