咨询热线:400-065-6886
首页>>技术支持>>科研进展

Python入门到底有多简单(三):填充数据


生信团 上海天昊生物
 

目录

1.加载包和数据读取
2.数据填充
    2.1 用数值或字符串填充
    2.2 用字典填充
    2.3 method参数填充
      2.3.1 用前面的值填充
      2.3.2 用后面的值填充
      2.3.3 limit限制填充的个数
      2.3.4 axis=1 修改填充方向


上篇【Python入门到底有多简单】之groupby数据分类汇总(二)中,末尾我们生成文件phylum_1.xlsx,phylum列有单元格是合并状态,在pandas重新读取后会出现NaN,因此需要对NaN数据进行填充后分析。本次介绍几种填充方法。



In [1]:

import pandas as pd

In [2]:
df = pd.read_excel('data/ASV/phylum_1.xlsx')df

Out[2]:






2.1用数值或字符串填充

In [3]:
NaN处均填充数值666
df.fillna(666)

Out[3]:




In [4]:
NaN处均填充uncultured
df.fillna('uncultured')

Out[4]:



2.2用字典填充

In [5]:
字典格式{key1:value1,key2:value2,......}
df.fillna({'phylum':666})

Out[5]:



2.3method参数填充
    2.3.1用前面的值填充

In [6]:
df.fillna(method='ffill')

Out[6]:


 


  2.3.2用后面的值填充

In [7]:
df.fillna(method='bfill')

Out[7]:



    2.3.3limit限制填充的个数
In [8]:
df.fillna(method='ffill',limit=2)

Out[8]:



    2.3.4axis=1 修改填充方向
默认参数数axis=0,按列填充。axis=1则按照行填充。bfill按照后面的值填充

In [9]:
df.fillna(method='bfill',axis=1)

Out[9]:



inplace=True直接修改原对象
inplace参数默认为False,填充后不改变原数据。inplace=True则将原数据直接改变。

In [10]:
df.fillna(method='ffill',inplace=True)df

Out[10]:



往期相关链接:
1、R基础篇
excel不熟练怎么办,R来帮您(一)数据分类汇总
如何使用Rstudio练习R基础教程
R相关软件及R包安装
【零基础学绘图】之气泡图绘制(六)
【零基础学绘图】之绘制venn图(五)
【零基础学绘图】之绘制barplot柱状图图(四)
【零基础学绘图】之绘制heatmap图(三)
【零基础学绘图】之绘制PCA图(二)
【零基础学绘图】之alpha指数箱体图绘制(一)


2、R进阶
ggplot2参数设置麻烦?试试ggpar!
【绘图进阶】之带连线的箱体图绘制(8)
【绘图进阶】之配对箱体图绘制(七)
【绘图进阶】之通路与菌的相关性分析热图(六)
【绘图进阶】之lefse定制化绘图(五)
【绘图进阶】之六种带中心点的PCA 图和三维PCA图绘制(四)
【绘图进阶】之交互式可删减分组和显示样品名的PCA 图(三)
【绘图进阶】之绘制PCA biplot图(二)
【进阶篇绘图】之带P值的箱体图、小提琴图绘制(一)


3.python基础篇
【Python入门到底有多简单】之groupby数据分类汇总(二)
Python入门到底有多简单(一):数据读写与输出


4、数据提交
3分钟学会微生物多样性云平台数据分析;
3分钟学会CHIP-seq类实验测序数据可视化 —IGV的使用手册
10分钟搞定多样性数据提交,最快半天内获取登录号,史上最全的多样性原始数据提交教程
20分钟搞定GEO上传,史上最简单、最详细的GEO数据上传攻略


5、表达谱分析
表达谱分析(二)通路富集分析和基因互作网络图绘制
如何对GEO数据进行差异分析
miRNA靶基因预测软件__miRWalk 3.0


6、医学数据分析
KING: 样本亲缘关系鉴定工具
【WGS服务升级】人工智能软件SpliceAI助力解读罕见和未确诊疾病中的非编码突变
隐性疾病trio家系别忽视单亲二倍体现象——天昊数据分析助力临床疾病诊断新添UPD(单亲二倍体)可视化分析工具
【昊工具】Oh My God! 太好用了吧!疾病或表型的关键基因查询数据库,我不允许你不知道Phenolyzer

 

天昊客户服务中心
手机/微信号:18964693703

【本群将为大家提供】

分享生信分析方案

提供数据素材及分析软件支持

定期开展生信分析线上讲座

QQ号:1040471849

 
 

作者:大熊

审核:有才

来源:天昊生信团

 

微信扫一扫
关注该公众号

 

 




上海昊为泰生物科技有限公司 版权所有 沪ICP备18028200号-1
地址:上海市浦东新区康桥路787号9号楼 邮箱:techsupport@geneskies.com 电话:400-065-6886