TensorflowとPytorchがApple Siliconに対応したため、Pythonの機械学習・ディープラーニング環境を構築します。
仮想環境の作成
仮想環境を作成します。
使用するPythonのバージョンですが、このあとインストールするTensorflowが執筆時点では3.7から3.10をサポートしており、Pytorchが3.7以上をサポートしているため、3.10を使用することにします。
conda create -n datascience python=3.10
conda activate datascience
ここでは仮想環境の名前をdatascience
にしていますが、任意の名前で構いません。
機械学習関連
機械学習関連のパッケージをインストールします。
機械学習でよく使われるパッケージをインストールします。
conda install numpy scipy pandas scikit-learn
代表的な可視化パッケージをインストールします。
conda install matplotlib seaborn plotly
EDAパッケージをインストールします。
conda install -c conda-forge pandas-profiling autoviz sweetviz
ローコード機械学習をインストールします。
conda install -c conda-forge pycaret
Jupyter notebookをインストールします。
conda install notebook
スクレイピング関連
スクレイピングでよく使用されるパッケージをインストールします。
conda install -c conda-forge requests scrapy beautifulsoup4
画像処理関連
画像処理でよく使用されるパッケージをインストールします。
conda install -c conda-forge pillow opencv
ディープラーニング関連
TensorflowとPytorchをインストールします。
Tensorflow
Xcode Command Line Toolをインストールしていない場合は以下のコマンドでインストールします。
xcode-select --install
Tensorflow dependenciesをインストールします。
conda install -c apple tensorflow-deps
Tensorflowをインストールします。
pip install tensorflow-macos
Metalプラグインをインストールします。
pip install tensorflow-metal
インストール後にGPUが使用可能か確認しましょう。
import sys
import tensorflow.keras
import pandas as pd
import sklearn as sk
import scipy as sp
import tensorflow as tf
import platform
gpu = len(tf.config.list_physical_devices('GPU'))>0
print("GPU is", "available" if gpu else "not available")
以下のように表示されればGPUが使用可能です。
GPU is available
Pytorch
PytorchはTensorflowに比べるとインストールは簡単です。以下のコマンドでインストールします。
pip install --pre torch torchvision --extra-index-url https://download.pytorch.org/whl/nightly/cpu
インストール後にGPUが使用可能か確認しましょう。
import torch
gpu = torch.backends.mps.is_available()
print("GPU is", "available" if gpu else "not available")
以下のように表示されればGPUが使用可能です。
GPU is available
今後の課題
現時点で形態素解析パッケージであるMecabのインストールに失敗しています。手順もいくつか示されていますが、実際に試したところいずれもうまくいっていません(インストール自体に失敗する、インストール後に動作しない)。
こちらは引き続きインストール方法を調査し、判明次第本記事を更新したいと思います。