数据分析之numpy(二)数据类型

  • Post author:
  • Post category:其他


2022.5.6

前置知识:

NumPy 中定义的最重要的对象是称为 ndarray 的 N 维数组类型。 它描述

相同类型的元素集合

。 可以使用基于零的索引访问集合中的项目。

ndarray中的每个元素在内存中使用相同大小的块。

ndarray中的每个元素是数据类型对象的对象

(称为 dtype)。



ndarray对象提取的任何元素(通过切片)由一个数组标量类型的 Python 对象表示

。 下图显示了ndarray,数据类型对象(dtype)和数组标量类型之间的关系。

numpy之ndarray

一、创建ndarray实例:

1)可以从任何暴露数组接口的对象,或从返回数组的任何方法创建一个ndarray。

numpy.array(object, dtype = None, copy = True, order = None, subok = False, ndmin = 0)

构造器的参数解释

在这里插入图片描述

其中,odject可以是多维元组、多维列表、集合、字典等

例子1:多维列表创建

# 多于一个维度  
此时需要注意 多维列表的每一维的元素数量需相同
import numpy as np 
a = np.array([[1,  2],  [3,  4]])  
#a = np.array([[1,  2],  [3]])  这样写是不行的 数组根据原有对象创建时,多维情况下要求每一维的元素数量相同
print a

例子2:最小维度数

# 最小维度  
import numpy as np 
a = np.array([1,  2,  3,4,5], ndmin =  2)  
print a
执行结果
[[1, 2, 3, 4, 5]]

2)numpy的数据类型

在这里插入图片描述

除了以上,还有自定义数据类型


NumPy 数字类型是dtype(数据类型)对象的实例

,每个对象具有唯一的特征。 类型可以是np.bool_,np.float32等。

数据类型对象描述了对应于数组的固定内存块的解释,取决于以下方面:

数据类型(整数、浮点或者 Python 对象)

数据大小

字节序(小端或大端)

在结构化类型的情况下,字段的名称,每个字段的数据类型,和每个字段占用的内存块部分。

如果数据类型是子序列,它的形状和数据类型。

字节顺序取决于数据类型的前缀<或>。 <意味着编码是小端(最小有效字节存储在最小地址中)。 >意味着编码是大端(最大有效字节存储在最小地址中)。

dtype可由一下语法构造:

class numpy.dtype(object, align, copy)
Object:被转换为数据类型的对象。
其作用就是将对象obj转成dtype类型的对象。
它带了两个可选的参数:

align - 是否按照C编译器的结构体输出格式对齐对象。
Copy - 是拷贝对象,还是对对象的引用。

dtype可以用来描述数据的类型(intfloat,Python对象等),描述数据的大小,数据的字节顺序(小端或大端)等。

实例1:

# 使用数组标量类型  
import numpy as np 
dt = np.dtype(np.int32)  #
#int8,int16,int32,int64 可替换为等价的字符串 'i1''i2''i4',以及其他。
print(dt)

实例2:

 
# 使用端记号  
import numpy as np 
dt = np.dtype('>i4')  
print(dt)
执行结果
>i4

下面的例子展示了结构化数据类型的使用。 这里声明了字段名称和相应的标量数据类型。

实例1:

 
# 首先创建结构化数据类型。  
import numpy as np 
dt = np.dtype([('age',np.int8)])  
print(dt)
执行结果
[('age', 'i1')] 

实例2:

# 现在将其应用于 ndarray 对象  
import numpy as np 
dt = np.dtype([('age',np.int8)]) 
a = np.array([(10,),(20,),(30,)], dtype = dt)  
print(a)
执行结果
[(10,) (20,) (30,)]

文件名亦可用于访问
import numpy as np 
 
dt = np.dtype([('age',np.int8)]) #定义数组数据类型并命名文件名
a = np.array([(10,),(20,),(30,)], dtype = dt)  
print a['age']

实例3:

import numpy as np 
student = np.dtype([('name','S20'),  ('age',  'i1'),  ('marks',  'f4')])  
print(student)
执行结果
[('name', 'S20'), ('age', 'i1'), ('marks', '<f4')])

实例4:

 
import numpy as np 
 
student = np.dtype([('name','S20'),  ('age',  'i1'),  ('marks',  'f4')]) 
a = np.array([('abc',  21,  50),('xyz',  18,  75)], dtype = student)  
print(a)
[('abc', 21, 50.0), ('xyz', 18, 75.0)]

实例5:

 
import numpy as np 
 
student = np.dtype([('name','S20'),  ('age',  'i1'),  ('marks',  'f4')]) 
a = np.array([('abc',  21,  50),('xyz',  18,  75)], dtype = student)  
print a



版权声明:本文为weixin_44494803原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。