NumPy は Pythonの行列計算ライブラリ
参考
http://pppurple.hatenablog.com/entry/2016/02/09/002648
SAKURA VPSにインストールしてみる。
pipをインストール
yum install epel-release yum install python-pip
pip自体をアップグレード
pip install --upgrade pip
NumPyをインストール
pip install numpy
ついでに、SciPy?をインストール
yum -y install lapack-devel pip install scipy
ついでに、pandasをインストール
pip install pandas
さらに、ついでに、matplotlibをインストール
yum install freetype yum install freetype-devel yum install libpng-devel
↓でエラー 本家サイトでみたら、windows版のやり方っぽい
pip install matplotlib
matplotlibの本家サイトにて確認 https://matplotlib.org/users/installing.html で、OKだったやり方は、こちら
yum install python-matplotlib
data.csv
101,102,103 201,202,203 301,302,303
#coding:utf-8 import csv #csvモジュールをインポートする f = open('data.csv', 'rb') dataReader = csv.reader(f) for row in dataReader: print row
['101', '102', '103'] ['201', '202', '203'] ['301', '302', '303']
import csv as csv csv_file_object = csv.reader(open('./data/train.csv', 'rb')) header = csv_file_object.next() data=[] for row in csv_file_object: data.append(row)
http://peaceandhilightandpython.hatenablog.com/entry/2013/12/04/093359
http://rest-term.com/archives/2999/
集合関数などについて個別に紹介しているページ
http://pppurple.hatenablog.com/archive/category/python
新たな配列変数 = numpy.array(pythonの配列)
IDEつかってないので、メソッドの候補がでない、つまり、メソッドを知っていなくてはならない。
一般的な記憶力の場合、使えるメソッドの一覧のチートシートがあるといいかと思う。
ということで、スニペットか、ヘルプ参照の効率化の工夫が必要だとおもう。
ちなみに、仕様書のページは、あるには、あるが英語。
https://docs.scipy.org/doc/numpy/reference/arrays.ndarray.html#internal-memory-layout-of-an-ndarray
なので、日本語でアクセスできる工夫が必要。
ndarray.flags | 配列データのメモリレイアウト情報 (numpy.flagsobj) |
ndarray.ndim | 配列の次元数 |
ndarray.size | 配列の要素数 |
ndarray.shape | 各次元の要素数 |
ndarray.itemsize | 1要素のバイト数 |
ndarray.strides | 各次元で次の要素に移動する際に必要なバイト数 |
ndarray.nbytes | 配列全体のバイト数 |
ndarray.dtype | 配列要素のデータ型 (numpy.dtype) |
data[0:5, 5].astype(np.float) | stringをfloatに変換する |