Naive bayes là gì

1. Mô hình phân lớp là gì?

Một quy mô phân lớp là một mô hình Machine Learning dùng làm phân loại những trang bị mẫu mã dựa vào những công năng vẫn khẳng định.Quý khách hàng vẫn xem: Naive sầu bayes là gì

2. Mô hình phân lớp Naive Bayes

Naive sầu Bayes là 1 trong thuật toán phân lớp được quy mô hoá dựa trên định lý Bayes vào Tỷ Lệ thống kê:

*

, trong đó:

P(y|X) hotline là posterior probability: Xác Suất của kim chỉ nam y với ĐK bao gồm đặc trưng XP(X|y) Call là likelihood: Tỷ Lệ của đặc trưng X Lúc sẽ biết phương châm yP(y) Hotline là prior probability của mục tiêu yP(X) điện thoại tư vấn là prior probability của đặc trưng X

Tại trên đây, X là vector các đặc trưng, có thể viết dưới dạng:


*

*

Trong mô hình Naive Bayes, có nhì giả thiết được đặt ra:

Các đặc trưng đưa vào mô hình là tự do cùng nhau. Tức là sự biến hóa quý hiếm của một đặc trưng không tác động mang đến các đặc trưng sót lại.Các đặc trưng chuyển vào quy mô bao gồm ảnh hưởng ngang bằng đối với đầu ra output phương châm.

Bạn đang xem: Naive bayes là gì

lúc đó, tác dụng kim chỉ nam y nhằm P(y|X) đạt cực lớn trnghỉ ngơi thành:

*

Chính vị hai mang thiết gần như ko sống thọ vào thực tế bên trên, quy mô này bắt đầu được hotline là naive sầu (ntạo thơ). Tuy nhiên, chính vì sự dễ dàng và đơn giản của nó cùng với việc dự đân oán khôn cùng nhanh khô công dụng đầu ra khiến cho nó được áp dụng rất nhiều vào thực tiễn bên trên phần đông cỗ dữ liệu lớn, mang đến tác dụng rõ ràng. Một vài áp dụng của Naive Bayes hoàn toàn có thể nói đến như: lọc thư rác rến, phân loại văn uống bạn dạng, dự đoán sắc đẹp thái văn uống phiên bản, ...

3. Một số giao diện mô hình Naive sầu Bayes

3.1. Multinomial Naive sầu Bayes

Mô hình này hầu hết được áp dụng vào phân một số loại vnạp năng lượng bạn dạng. đặc biệt nguồn vào tại chỗ này đó là tần suất xuất hiện thêm của từ bỏ vào vnạp năng lượng bản kia.

Xem thêm:

3.2. Bernoulli Naive Bayes

3.3. Gaussian Naive Bayes

khi những đặc trưng dấn quý hiếm thường xuyên, ta mang sử các đặc trưng kia gồm phân păn năn Gaussian. Lúc đó, likelihood sẽ sở hữu được dạng:

*

4. Ví dụ

Xét một bộ dữ liệu dễ dàng về câu hỏi đi làm việc muộn của một các bạn nhân viên cấp dưới. Sở tài liệu được biểu diễn dạng bảng dưới đây:

Giờ dậy (x1)Sức khoẻ (x2)Thời máu (x3)Đi muộn (y)
1SớmTốtNắngKhông
2SớmXấuMưaKhông
3Bình thườngTốtNắng
4MuộnXấuNắng
5SớmXấuđa phần mâyKhông
6Bình thườngXấuphần lớn mâyKhông
7MuộnTốtNắng
8Bình thườngTốtNắngKhông
9SớmXấuNhiều mây
10MuộnTốtMưa

Bằng câu hỏi lập bảng tần suất (frequency table) đến từng đặc trưng theo kim chỉ nam, hoàn toàn có thể tính được likelihood P(X|y).

Giờ dậy (x1)

MuộnKhông muộnP(x1|Muộn)P(x1|Không muộn)
Sớm131/53/5
Bình thường121/52/5
Muộn303/50/5

Sức khoẻ (x2)

MuộnKhông muộnP(x2|Muộn)P(x2|Không muộn)
Tốt323/52/5
Xấu232/53/5

Thời máu (x3)

MuộnKhông muộnP(x3|Muộn)P(x3|Không muộn)
Nắng323/52/5
phần lớn mây121/52/5
Mưa111/51/5

Giả sử, để tham gia đân oán cho một ngày X=(Muộn, Xấu, Mưa), bắt buộc tính:

P(Muộn|X) ∝ P(Muộn|Muộn) * P(Xấu|Muộn) * P(Mưa|Muộn) * P(Muộn) = (3/5) * (2/5) * (1/5) * (5/10) = 0.024

P(Không muộn|X) ∝ P(Muộn|Không muộn) * P(Xấu|Không muộn) * P(Mưa|Không muộn) * P(Không muộn) = (0/5) * (3/5) * (1/5) * (5/10) = 0

=> y = argmaxy)P(y) = Muộn.

Xem thêm:

4. Kết luận

Mô hình Naive Bayes là mô hình phân lớp dễ dàng dễ dàng setup, bao gồm vận tốc cách xử trí nhanh khô. Tuy nhiên có điểm yếu to là kinh nghiệm các đặc trưng đầu vào bắt buộc tự do, nhưng vấn đề này cạnh tranh xẩy ra trong thực tiễn làm bớt chất lượng của mô hình. Thuật tân oán này hay được áp dụng vào so sánh sắc đẹp thái, lọc thư rác, recommendation systems, ...


Chuyên mục: Tổng Hợp