Ex 2: Plot randomly generated classification dataset 分類數據集

機器學習資料集/ 範例二: Plot randomly generated classification dataset

https://scikit-learn.org/stable/auto_examples/datasets/plot_random_dataset.html

這個範例實現了 datasets.make_classification datasets.make_blobs 以及 datasets.make_gaussian_quantiles 的函數運用

(一)Make classification

對於make_classification的函數,隨機生成n種不同的分類數據集,每個類別具有不同數量的信息特徵和群聚。

plt.title("One informative feature, one cluster per class", fontsize='small')
X1, Y1 = make_classification(n_features=2, n_redundant=0, n_informative=1,
                             n_clusters_per_class=1)
plt.scatter(X1[:, 0], X1[:, 1], marker='o', c=Y1,
            s=25, edgecolor='k')

針對不同數量的信息特徵和群聚會產生不同結果

(二)Make blobs

對於make_blobs的函數,會產生同向心性的高斯分布群。

(三)Make gaussian quantiles

對於make_gaussian_quantiles的函數,用分位數生成各向同性的高斯並標記樣本。

(四)完整程式碼

Python source code:plot_random_dataset.py

https://scikit-learn.org/stable/_downloads/9534d593e925347a4e0eee78c7d5b226/plot_random_dataset.py

Last updated