人工智能

2022-06-15 斯坦福大学计算机公开课资源

① CS 103 计算的数学基础 计算能力的理论极限是什么?计算机能解决哪些问题?哪些不能?我们如何以数学上的确定性来推理这些问题的答案?本课程探讨这些问题的答案,并作为离散数学、可计算性理论和复杂性理论的介绍。课程完成后,学生将能够轻松编写数学证明、推理离散结构、阅读和编写一阶逻辑语句,以及使用计算设备的数学模型。 学习地址: ② CS106a 编程

突破网页数据集获取难题:Web Unlocker API 助力 AI 训练与微调数据集全方位解决方案

突破网页数据集获取难题:Web Unlocker API 助力 AI 训练与微调数据集全方位解决方案 背景随着AI技术的飞速发展,诸如DeepSeek R1、千问QWQ32、文小言、元宝等AI大模型迅速崛起。在AI大模型训练和微调、AI知识库建设中,数据集的获取已成为不可或缺的基础。尤其是在面对各式各样的网页数据结构时,将其整理成可用的数据

使用二阶贝塞尔曲线画爱心

简介 上一篇这一篇让你彻底搞懂贝塞尔曲线的原理中,我们介绍了贝塞尔曲线的原理。这一篇我们先用二阶贝塞尔曲线来做一个应用 —— 绘制爱心。首先回顾一下二阶贝塞尔曲线。 二阶贝塞尔曲线 如上图所示,经过推导得出的曲线上的点 P 的计算公式如下: 二阶贝塞尔曲线计算公式 爱心绘制控制点 首先我们来看爱心使用二阶贝塞尔曲线如何实现。如下图所示,爱心可以分为4段曲线,分别是 P0-

Graphpad绘制森林图:

基本的原理也就是:提供数据生成主体(均值、区间、权重),图表组件定制(量程、坐标轴、辅助线),图表内容结合: 森林图:以无效线(横坐标刻度为0或1)为中心,结合了数字、文本、图形,同时展示各研究以及汇总研究结果的综合图形。) 黑点:代表每个研究效应量的点估计值 方块代表每个研究所占的权重,权重越大方块的面积越大 线段长度:代表每个研究效应量的95%可信区间 菱形:代表meta分析综合各个研究的汇

Linux内核通信seq_file详解

本文介绍的用法相对复杂, 简单的用法请参考 这篇文章 seq_file适用于内核需要向应用层输出信息时使用,最常见的用法是遍历内核中的一个list数据结构输出list的内容到应用层;当然也可以输出任意的数据,并且输出到应用层的数据大小没有限制,默认缓冲区是一个PAGE_SIZE,当输出的数据大于PAGE_SIZE时seq_file会把缓冲区大小翻倍,直到超过要输出的数据大小,或者把内存耗尽。 se

数据倾斜导致子任务积压

业务背景: 一个流程中,有两个重要子任务:一是数据迁移,将kafka实时数据落Es,二是将kafka数据做窗口聚合落hbase,两个子任务接的是同一个Topic GroupId。上游Topic的 tps高峰达到5-6w。 问题描述: 给 24个 TaskManager(CPU) 都会出现来不及消费的情况。 问题原因: 做窗口聚合的任务的分组字段,分组粒度太小,hash不能打散,数据倾斜严重,导致少

AI 的工具集专栏:选对工具做对事,高效玩转 AI 时代

AI 的工具集专栏:选对工具做对事,高效玩转 AI 时代 AI 的工具集专栏:选对工具做对事,高效玩转 AI 时代,本文介绍 “AI 的工具集专栏”,围绕主流 AI 工具展开,介绍其基本情况、优势、适用场景及使用技巧。学习该专栏能提升多种能力,包括识别和选择 AI 工具&#xff