Ex 2: Plot randomly generated classification dataset 分類數據集
機器學習資料集/ 範例二: Plot randomly generated classification dataset
https://scikit-learn.org/stable/auto_examples/datasets/plot_random_dataset.html
這個範例實現了 datasets.make_classification datasets.make_blobs 以及 datasets.make_gaussian_quantiles 的函數運用
(一)Make classification
對於make_classification的函數,隨機生成n種不同的分類數據集,每個類別具有不同數量的信息特徵和群聚。
plt.title("One informative feature, one cluster per class", fontsize='small')
X1, Y1 = make_classification(n_features=2, n_redundant=0, n_informative=1,
n_clusters_per_class=1)
plt.scatter(X1[:, 0], X1[:, 1], marker='o', c=Y1,
s=25, edgecolor='k')針對不同數量的信息特徵和群聚會產生不同結果
(二)Make blobs
對於make_blobs的函數,會產生同向心性的高斯分布群。
(三)Make gaussian quantiles
對於make_gaussian_quantiles的函數,用分位數生成各向同性的高斯並標記樣本。
(四)完整程式碼
Python source code:plot_random_dataset.py
https://scikit-learn.org/stable/_downloads/9534d593e925347a4e0eee78c7d5b226/plot_random_dataset.py
Last updated