分类 默认分类 下的文章

Pandas对缺失值的处理


Pandas使用这些函数处理缺失值:isnull和notnull:检测是否是空值,可用于df和seriesdropna:丢弃、删除缺失值axis:删除行还是列,{0 or "'index', 1 or 'columns'}, default o how:如果等于any则任何值为空都删除,如果等于all则所有值都为空才删除inplace :如果为True则修改当前df,否则返回新的dffillna:填充空值value:用于填充的值,可以是单个值,或者字典(key是列名,value是值)method:等于ffill使用前一个不为空的值填充forword fill;等于bfill使用后一个不为空的值填充backword fillaxis:按行还是列填充,{0 or 'index', 1 or 'columns"} inplace :如果为True...

Pandas新增数据列


在进行数据分析时,经常需要按照一定条件创建新的数据列,然后进行进一步分析。直接赋值实例:清理温度列,变成数字类型实例:计算温差df. apply方法Apply a function along an axis of the DataFrame.Objects passed to the function are Series objects whose index is either the DataFrame's index(axis=0) or the DataFrame's columns (axis=1).实例:添加一列温度类型:1.如果最高温度大于33度就是高温2.低于-10度是低温3.否则是常温df.assign方法Assign new columns to a DataFrame.Returns a new object with all ori...

Pandas数据查询


df.loc方法,根据行、列的标签值查询df.iloc方法,根据行、列的数字位置查询df.where方法df.query方法.loc既能查询,又能覆盖写入,强烈推荐!Pandas使用df.loc查询数据的方法预处理:使用单个label值查询数据行或者列,都可以只传入单个值,实现精确匹配:使用值列表批量查询使用数值区间进行范围查询区间既包含开始,也包含结束,注意其与切片的区别:使用条件表达式查询bool列表的长度得等于行数或者列数:简单条件查询,最低温度低于-10度的列表复杂条件查询,查一下我心中的完美天气注意,组合条件用&符号合并,每个条件判断都得带括号调用函数查询Pandas学习系列说明:本系列仅仅作为Pandas视频的归纳总结与记录,在此感谢蚂蚁学Python

Pandas初识


什么是Pandas?一个开源的Python类库:用于数据分析、数据处理、数据可视化高性能容易使用的数据结构·容易使用的数据分析工具很方便和其它类库一起使用numpy:用于数学计算scikit-learn:用于机器学习如何下载安装Pandas?下载使用Python类库集成安装包: anacondahttps://www.anaconda.com当今最流行的Python数据分析发行版已经安装了数据分析需要的几乎所有的类库pip install pandasPandas数据读取Pandas需要先读取表格类型的数据,然后进行分析数据类型说明Pandas读取方法csv、tsv、txt用逗号分隔、tab分割的纯文本文件pd.read_csvexcel微软xls或者xlsx文件pd.read_excelmysql关系型数据库表pd.read_sqlPandas读取excel...

计算机组成原理之概述篇


计算机发展简史一、计算机发展的四个阶段第一阶段:电子管计算机第二次世界大战是电子管计算机产生的催化剂(英国为了解密德国海军的密文)特点:集成度小,空间占用大功耗高,运行速度慢操作复杂,更换程序需要接线战争使用了飞机和火箭打得准则需要计算射击参数射击参数需要几千次运算才能计算出来第二阶段:晶体管计算机贝尔实验室的三个科学家发明了晶体管特点:集成度相对较高,空间占用相对小功耗相对较低,运行速度较快操作相对简单,交互更加方便第三阶段:集成电路计算机德州仪器的工程师发明了集成电路(IC)特点:计算机变得更小功耗变得更低计算速度变得更快IBM推出兼容的产品System/360 => 操作系统的雏形超大规模集成电路计算机特点:一个芯片集成了上百万的晶体管速度更快,体积更小,价格更低,更能被大众接受用途丰富:文本处理、表格处理、高交互的游戏与应用二、微型计算机的发展历...

召唤看板娘