科学学习--后端、前端、移动开发、大数据、Java、Python、Vue开发经验分享

科学学习

针对深度学习的“失忆症”，科学家提出基于相似性加权交错学习
来源：AI科技评论本文约9600字，建议阅读15分钟本文介绍了神经科学和机器学习的进一步发展。复制与人类不同，人工神经网络在学习新事物时会迅速遗忘先前学到的信息，必须通过新旧信息的交错来重新训练；但是，交错全部旧信息非常耗时，并且可能没有必要。只交错与新信息有实质相似性的旧信息可能就足够了。近日，美国科学院院报（PNAS）刊登了一篇论文，“Learning in deep neural netwo
日期 2023-06-12 10:48:40
【2022新书】药物开发中的数据科学、人工智能和机器学习
来源：专知本文为书籍介绍，建议阅读5分钟本书旨在提供大数据、人工智能和ML在整个药物研发领域的新兴应用的单一信息来源，并建立一个强大的数据科学组织，推动药物发现、开发和交付的新方法。复制大数据、人工智能(AI)和机器学习(ML)的融合导致了创新药物开发和医疗健康提供的范式转变。为了充分利用这些技术进步，必须系统地利用来自不同来源的数据，并利用数字技术和先进的分析技术，以实现数据驱动的决策。数据科学
日期 2023-06-12 10:48:40
NeurIPS 2022 | 首个标注详细解释的多模态科学问答数据集，深度学习模型推理有了思维链
机器之心专栏机器之心编辑部在回答复杂的问题时，人类可以理解不同模态的信息，并形成一个完整的思维链（Chain of Thought, CoT）。深度学习模型是否可以打开「黑箱」，对其推理过程提供一个思维链呢？近日，UCLA 和艾伦人工智能研究院（AI2）提出了首个标注详细解释的多模态科学问答数据集 ScienceQA，用于测试模型的多模态推理能力。在 ScienceQA 任务中，作者提出 GPT-
日期 2023-06-12 10:48:40
Science Advances:社会和健康科学中用于描述、预测和因果推理的机器学习方法
社会和健康科学中使用的机器学习（ML）方法需要符合描述、预测或因果推理等预期研究目的。本文通过结合这些学科的统计分析的必要要求，为社会和健康科学中的研究问题与适当的ML方法进行了全面、系统的元映射。作者将已建立的分类映射到描述、预测、反事实预测和因果结构学习，以实现共同的研究目标，如估计不良社会或健康结果的流行率、预测事件的风险、识别不良结果的风险因素或原因，并解释通用的ML性能指标。这种映射可能
日期 2023-06-12 10:48:40
15.计算机科学导论之数据压缩学习笔记
[TOC]计算机科学导论学习笔记第 5 部分数据安全与人工智能此部分包含第15、16、17和18章，包含了计算机中传输的数据压缩(有损与无损)、网络数据在传输过程中如何保证其数据安全, 讨论计算理论，即哪些是可计算的，哪些是不可计算的，最后介绍当前热门的人工智能(AI)的观点，加深我们对计算机数据处理的的认识，为后续学习扩展基础认识。原文地址: 第15章数据压缩15.1 前言简述近年来，随着计
日期 2023-06-12 10:48:40
张东晓院士：科学机器学习中的知识嵌入与知识发现
机器之心报道机器之心编辑部1 月 11 日，在机器之心 AI 科技年会上，讲席教授、美国国家工程院院士、东方理工高等研究院常务副院长张东晓教授发表主题演讲《科学机器学习中的知识嵌入与知识发现》，在演讲中，他简要介绍了数据驱动模型的前沿技术，之后重点介绍了理论指导的数据驱动模型 —— 知识嵌入，以及数据驱动的模型挖掘 —— 知识发现。张院士指出，机器学习算法可以有效解决具有复杂非线性映射关系的问题；
日期 2023-06-12 10:48:40
科学家直指DeepMind，“强化学习无法实现通用人工智能”
本文来自微信公众号：学术头条（ID：SciTouTiao），作者：XT，编审：寇建超，头图来自：视觉中国今年 6 月，DeepMind 首席研究科学家、伦敦大学学院教授 David Silver 及其合作者在一篇题为《Reward is enough》的论文中指出，人工智能及其相关能力不是通过制定和解决复杂问题而产生的，而是通过坚持一个简单而强大的原则：奖励最大化。Silver 等人认为
日期 2023-06-12 10:48:40
一份不可多得的数据科学与机器学习Python库
图片来自 Pexels 根据当前技术界的广泛需求，本文将以如下顺序重点介绍，市场上适合于数据科学和机器学习实现的优秀 Python 软件：数据科学与机器学习的介绍为什么要使用 Python 进行数据科学和机器学习? 用于数据科学和机器学习的 Python 库数据科学与机器学习的介绍众所周知，我们正处在一个大数据的时代，数据是驱动机器模型发展的“燃料”。实际上，数据科学和
日期 2023-06-12 10:48:40
课程预告 | 星云Clustar首席科学家胡水海：如何定义联邦学习新算力？
尽管联邦学习在隐私保护和数据安全上有着众多优势，但这一技术目前也存在不小进步空间，效率就是亟待改善的问题之一。联邦学习的模型训练过程，很难绕开同态计算和密文传输，二者对算力和网络都有严苛的要求，星云Clustar也因此选择从GPU加速同态运算，以及高速网络助力密文传输效力的角度切入，来改善联邦学习的计算速度。如何理解联邦学习的性能与效率问题？星云Clustar的解决思路又是怎样的？6月4日
日期 2023-06-12 10:48:40
Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱（转）
原文：http://www.52nlp.cn/python-网页爬虫-文本处理-科学计算-机器学习-数据挖掘曾经因为NLTK的缘故开始学习Python，之后渐渐成为我工作中的第一辅助脚本语言，虽然开发语言是C/C++，但平时的很多文本数据处理任务都交给了Python。离开腾讯创业后，第一个作品课程图谱也是选择了Python系的Flask框架，渐渐的将自己的绝大部分工作交给了Python。这些年
日期 2023-06-12 10:48:40
ML：数据科学/机器学习领域经验总结—对于特征个数大于样本量的高维数据集，用什么算法进行预测，效果会更好？
ML：数据科学/机器学习领域经验总结—对于特征个数大于样本量的高维数据集，用什么算法进行预测，效果会更好？目录
日期 2023-06-12 10:48:40
AI之DS：人工智能领域之数据科学领域六大实践场景(金融信用违约、反欺诈模型、客户偏好洞察、智能推荐、精准营销、客户流失管理)所对应的机器学习算法总结(持续更新)
AI之DS：人工智能领域之数据科学领域六大实践场景(金融信用违约、反欺诈模型、客户偏好洞察、智能推荐、精准营销、客户流失管理)所对应的机器学习算法总结(持续更新) 目录
日期 2023-06-12 10:48:40
DS：机器学习之数据科学方向最强学习路线之数据分析、数据挖掘、机器学习工程化团队之详细攻略(更新中)
DS：机器学习之数据科学方向最强学习路线之数据分析、数据挖掘、机器学习工程化团队之详细攻略(更新中) 目录最强学习路线 DS市场岗位要求 DS应用领域基本必备技能
日期 2023-06-12 10:48:40
科学学习

日期 2023-06-12 10:48:40
转行入职数据科学（数据分析挖掘，机器学习方向）需要的硬技能。

日期 2023-06-12 10:48:40
【C++ 科学计算】机器学习算法 Dlib 编译安装（ubuntu）
目录 1、下载 2、Dlib 编译安装 1、下载用于在C++中制作真实世界机器学习和数据分析应用程序的工具包。戴维斯金/dlib：用于在C++中制作真实世界机器学习和数据分析应用程序的工具包 (github.com)
日期 2023-06-12 10:48:40
科学式家｜杨强教授漫谈《西部世界》、生成式对抗网络及迁移学习
「范式大学」由第四范式发起，致力于成为“数据科学家”的黄埔军校，校长为第四范式首席科学家，华人界首个国际人工智能协会AAAI Fellow、唯一的AAAI 华人执委杨强教授。［范式大学］在探索AI工业化的同时，也关注最新学术研究成果。近日，杨强教授在［范式大学］内部课程中，与大家分享了他在 “生成式对抗网络模型“ 和迁移学习等领域的独特见解和最新思考。在此特别感谢杨教授的博士生张颖华同学
日期 2023-06-12 10:48:40
构建你的数据科学作品集：机器学习项目
数据科学公司在决定雇佣时越来越关注你在数据科学方面的作品集Portfolio。这其中的一个原因是，这样的作品集是判断某人的实际技能的最好的方法。好消息是构建这样的作品集完全要看你自己。只要你在这方面付出了努力，你一定可以取得让这些公司钦佩的作品集。构建高质量的作品集的第一步就是知道需要什么技能。公司想要在数据科学方面拥有的、他们希望你能够运用的主要技能有：数据推理能力动机和主动性任
日期 2023-06-12 10:48:40
《Python数据科学指南》——2.4　使用scikit-learn进行机器学习
本节书摘来自异步社区《Python数据科学指南》一书中的第2章，第2.4节，作者[印度] Gopi Subramanian ，方延风刘丹译，更多章节内容可以访问云栖社区“异步社区”公众号查看。 2.4 使用scikit-learn进行机器学习 scikit-learn是Python中的一个全能的机器学习库，我们在本书中会大量使用它。我们使用的版本为0.15.2。你可以在命令行里调用_ver
日期 2023-06-12 10:48:40
《机器学习与数据科学（基于R的统计学习方法）》——1.1　机器学习的分类
本节书摘来异步社区《机器学习与数据科学（基于R的统计学习方法）》一书中的第1章，第1.1节，作者：【美】Daniel D. Gutierrez（古铁雷斯），更多章节内容可以访问云栖社区“异步社区”公众号查看。 1.1 机器学习的分类本书会向读者介绍机器学习的基本原理。作为数据科学和大数据产业的主要推动力，机器学习在众多行业中广受关注，它可以为企业提供使公司数据资产增值的新方法。在本书中，我们
日期 2023-06-12 10:48:40
《机器学习与数据科学（基于R的统计学习方法）》——1.8　使用R包
本节书摘来异步社区《机器学习与数据科学（基于R的统计学习方法）》一书中的第1章，第1.8节，作者：【美】Daniel D. Gutierrez（古铁雷斯），更多章节内容可以访问云栖社区“异步社区”公众号查看。 1.8 使用R包 R以一种非常积极的方式拥抱开源，通过使用所谓的“包”来扩展软件的基本功能。有大量的通用包（当前大约是7000个），其中很多涉及有用的统计方法，也有特定领域的包：金融、天
日期 2023-06-12 10:48:40
《机器学习与数据科学（基于R的统计学习方法）》——1.11　小结
本节书摘来异步社区《机器学习与数据科学（基于R的统计学习方法）》一书中的第1章，第1.11节，作者：【美】Daniel D. Gutierrez（古铁雷斯），更多章节内容可以访问云栖社区“异步社区”公众号查看。 1.11 小结在本章中，我们对机器学习领域（也被称为统计学习）进行了介绍。另外，我们做好了开始一个数据科学项目的准备，并提供了一个路线图来作为本书的向导。建立一个机器语言解决方案的第
日期 2023-06-12 10:48:40
《机器学习与数据科学（基于R的统计学习方法）》——第2章　连接数据
本节书摘来异步社区《机器学习与数据科学（基于R的统计学习方法）》一书中的第2章，作者：【美】Daniel D. Gutierrez（古铁雷斯），更多章节内容可以访问云栖社区“异步社区”公众号查看。第2章连接数据机器学习与数据科学（基于R的统计学习方法）数据科学和它的使能技术机器学习一样，都是关于数据的，即使用海量数据训练算法，对未来事件作出预测；也会对存储的数据进行筛查，发现对商
日期 2023-06-12 10:48:40
《机器学习与数据科学（基于R的统计学习方法）》——2.6　读取Excel文件
本节书摘来异步社区《机器学习与数据科学（基于R的统计学习方法）》一书中的第2章，第2.6节，作者：【美】Daniel D. Gutierrez（古铁雷斯），更多章节内容可以访问云栖社区“异步社区”公众号查看。 2.6 读取Excel文件机器学习中另一种重要的文件类型是Excel。Excel是应用很广泛的电子表格软件，各种规模的企业都依赖这个工具来存储商业信息。这样一来，你希望在机器学习中使用
日期 2023-06-12 10:48:40
《机器学习与数据科学（基于R的统计学习方法）》——2.7　使用文件连接
本节书摘来异步社区《机器学习与数据科学（基于R的统计学习方法）》一书中的第2章，第2.7节，作者：【美】Daniel D. Gutierrez（古铁雷斯），更多章节内容可以访问云栖社区“异步社区”公众号查看。 2.7 使用文件连接另一种从数据源中读取信息的方式是通过文件连接。利用连接，你可以读入CSV文件，就像我们在前面看到的那样。不同的是，你也可以从文本文件中读取数据行。在数据不太规整的情
日期 2023-06-12 10:48:40
《机器学习与数据科学（基于R的统计学习方法）》——2.12　读取Twitter数据
本节书摘来异步社区《机器学习与数据科学（基于R的统计学习方法）》一书中的第2章，第2.12节，作者：【美】Daniel D. Gutierrez（古铁雷斯），更多章节内容可以访问云栖社区“异步社区”公众号查看。 2.12 读取Twitter数据鉴于数据科学正在快速演变，我们可以看到社交媒体中的非结构化数据正在为传统的数据源增添异彩。毋庸置疑的是，最流行的社交媒体数据源是Twitter。“非结
日期 2023-06-12 10:48:40
（数据科学学习手札135）tenacity：Python中最强大的错误重试库
本文示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介　　我们在编写程序尤其是与网络请求相关的程序，如调用web接口、运行网络爬虫等任务时，经常会遇到一些偶然发生的请求失败的状况，这种时候如果我们仅仅简单的捕捉错误然后跳过对应任务，肯定是不严谨的，尤其是在网络爬虫中，会存在损失有价值数据的
日期 2023-06-12 10:48:40
（数据科学学习手札125）在Python中操纵json数据的最佳方式
本文示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介　　在日常使用Python的过程中，我们经常会与json格式的数据打交道，尤其是那种嵌套结构复杂的json数据，从中抽取复杂结构下键值对数据的过程枯燥且费事。　　而熟悉xpath的朋友都知道，对于xml格式类型的具有层次结构的数据，我
日期 2023-06-12 10:48:40
（数据科学学习手札100）搞定matplotlib中的字体设置
本文示例文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介　　matplotlib作为数据可视化的利器，被广泛用于数据分析之中，但不太友好的是matplotlib中书写非英文文字内容时，如果不事先对字体进行相关设置，会发现绘制出的诸如中文等均显示为方块乱码，而今天的内容，我们就来小小总结一下matp
日期 2023-06-12 10:48:40
（数据科学学习手札97）掌握pandas中的transform
本文示例文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介　　开门见山，在pandas中，transform是一类非常实用的方法，通过它我们可以很方便地将某个或某些函数处理过程（非聚合）作用在传入数据的每一列上，从而返回与输入数据形状一致的运算结果。　　本文就将带大家掌握pandas中关于tran
日期 2023-06-12 10:48:40
（数据科学学习手札93）利用geopandas与PostGIS进行交互
本文完整代码及数据已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介　　PostGIS作为postgresql针对地理空间数据的拓展功能，可以帮助我们有效管理和固化空间矢量数据，以及开展空间数据分析，而geopandas作为Python生态中优秀的空间数据分析处理工具，自然在与PostGIS进行交互方面
日期 2023-06-12 10:48:40