数据狂欢-解析数据集市|学习笔记 一、怎么正确理解数据集市 举个例子: 数据集市就像宜家楼上的展厅,这是一个面向最终用户的数据市场,在这里,数据(家具)以一种更加容易被业务人员接受的方式组合在一起,这些组合方式可能是多变的,因为业务人员的需求是多变的,因此我们需要定期调整集市的计算口径(展厅的陈列方式),经常会创建新的数据集市(装修新的展厅)。 数据集市源起: 美国数据交易产业是在数据经纪产业的基础上发展起来的,数据 人工智能 2025年12月01日 108 点赞 0 评论 9179 浏览
HYphy Hyphy的官网: Hyphy(Hypothesis Testing using Phylogenies)是一个通过系统发育学、分子演化和机器学习技术分析遗传序列(尤其是推断是否存在自然选择)的开源软件包。 HYphy的用途: HYphy is most commonly used for characterzing the evoluti 人工智能 2025年12月01日 138 点赞 0 评论 19952 浏览
天文速递(8月上篇) 原创 赵冬瑶《天文爱好者杂志》 图:盖亚航天器的艺术图,背景为银河系。图源:ESA/ATG medialab; background image: ESO/S. Brunier 欧洲航天局于2022年6月13日释放了盖亚任务的新数据,这批新数据为天文学家理解银河系的形成和演化开启了全新的阶段。盖亚(GAIA,Global Astrometric Interferomet 人工智能 2025年12月01日 160 点赞 0 评论 13109 浏览
数据的应用 上学的时候学习的统计学,后来工作又做了财务分析,所以我对数据有特殊的感情。当然我说的数据,不仅仅是数字,它还有各种各样的形式,比如说文字、图像等等。 人类的进步在于对数据的传递和应用,也在于持续的记录和不断的验证。对于数据的应用,我觉得主要有几点可以重点关注: 1、记录数据 数据记录是起点,这个记录可以是对历史过往的追溯,也可以是对当前发生事情的记录,当然也可以是对未来前景的一些展望。(以我目前的 人工智能 2025年11月30日 80 点赞 0 评论 11102 浏览
四步完成单细胞数据调控网络流程分析-SCENIC/pySCENIC-2022-09-06 适用背景 单细胞转录组调控网络分析是单细胞转录组分析内容的高级分析之一,本文将介绍SCENIC/pySCENIC的流程,具体原理和内容不展开,主要展示代码复现流程。R的SCENIC基于AUCell,RcisTarget和GENIE3三个包进行分析,所以要先安装这些依赖包,而pySCENIC则已经封装好,直接用pip安装即可。只用SCENIC或pySCENIC也可以单独完成分析,但R语言运行起来很慢 人工智能 2025年11月30日 68 点赞 0 评论 7872 浏览
第一章 理解高性能程序(6) - 多核 多核 功率极限问题最终是可以克服的。冷却是一种方法。或者是降低CPU频率的同时引入可并行工作的处理器核心,增加更多的通用处理器、支持向量处理的单指令多数据(SIMD, Single instruction multiple data),或增加不需要一直供电的器件。通过这些方法,晶体管的密度不会再增加,从而避免芯片过热的问题。 当一块芯片上有多个CPU核,被称为对 人工智能 2025年11月29日 94 点赞 0 评论 20004 浏览
Kafka可视化管理工具kafka-manager部署安装和使用-已更名为CMAK 一、kafka-manager 简介 为了简化开发者和服务工程师维护Kafka集群的工作,yahoo构建了一个叫做Kafka管理器的基于Web工具,叫做 Kafka Manager。 这个管理工具可以很容易地发现分布在集群中的哪些topic分布不均匀,或者是分区在整个集群分布不均匀的的情况。 它支持管理多个集群、选择副本、副本重新分配以及创建Topic。同时,这个管理工具也是一个非常好的可以快速浏 人工智能 2025年11月29日 92 点赞 0 评论 11771 浏览
心理学研究方法(12) 中原焦点团队坚持分享第1074天(20230113) Q技术是以人为分析单元,重点在分析人际的关系,是由斯蒂夫森提出,用以研究所谓人间关系。以Q方法论为基础,通过Q技术基础来说明Q方法的具体程序。适合于小样本或少数被试。运用测量之间的相关信息进行研究分类为R方法论。Q方法是计算人之间的相关,把人分成几种群类,从而分析不同类型的人员。 Q技术运用等级顺序程序对客体分类,客体可以是陈述语句、单词或图片 人工智能 2025年11月29日 198 点赞 0 评论 6358 浏览
Alibaba最新神作!耗时182天肝出来1015页分布式全栈手册太香了 前言 到底什么是分布式?这个话题一直以来就在各大平台论坛上被热议。一千个读者里面就有一千个哈姆雷特。官方这边给出的结论是:分布式就是将相同或相关的程序运行在多台计算机上,从而实现特定目标的一种计算方式。而从分布式技术的起源来看,随之诞生的分布式系统就是用更多的机器,处理更多的数据和更复杂的任务。 一个篱笆三个桩,一个好汉三个帮。虽然分布式系统让更多的服务器进行协作,提供了更强大的数据处理能力,解决 人工智能 2025年11月28日 178 点赞 0 评论 14954 浏览
Chatgpt有什么用途? Chatgpt是一款基于OpenAI的GPT-3.5和GPT-4.0开发的语言模型。作为一款语言模型,Chatgpt可以执行各种任务,例如回答问题、提供��息、生成文本、翻译语言、总结文本等等。 Chatgpt的核心是GPT(Generative Pre-trained Transformer)技术,这是一种基于Transformer的语言生成模型。GPT使用无标注文本进行预训练,具有强大的自然语 人工智能 2025年11月26日 109 点赞 0 评论 1779 浏览