Thống kê và trực quan hóa dữ liệu bằng Python
Nội dung chính mà cuốn sách bao gồm:
- Nhập môn về Thống kê:
- Tổng quan về thống kê cơ bản: mean, median, mode, standard deviation, variance, skewness, kurtosis.
- Các phương pháp phân phối xác suất: phân phối chuẩn, phân phối Poisson, phân phối binomial, v.v.
- Giả thuyết thống kê và kiểm định giả thuyết (hypothesis testing).
- Xử lý và Phân tích Dữ liệu với Python:
- Sử dụng các thư viện Python phổ biến như
Pandas
,NumPy
, vàSciPy
để xử lý dữ liệu và tính toán các giá trị thống kê. - Tính toán và làm việc với các tập dữ liệu lớn (Big Data).
- Xử lý dữ liệu thiếu hoặc dữ liệu bất thường.
- Sử dụng các thư viện Python phổ biến như
- Trực quan hóa Dữ liệu:
- Giới thiệu về các nguyên tắc trực quan hóa dữ liệu.
- Hướng dẫn sử dụng các thư viện Python như
Matplotlib
,Seaborn
, vàPlotly
để vẽ biểu đồ. - Các loại biểu đồ: biểu đồ cột (bar plot), biểu đồ phân tán (scatter plot), biểu đồ hộp (box plot), biểu đồ nhiệt (heatmap), v.v.
- Tạo ra các biểu đồ tương tác cho việc phân tích sâu hơn.
- Mô hình hóa Dữ liệu và Thống kê Suy luận:
- Giới thiệu về thống kê suy luận và cách áp dụng các mô hình dự đoán.
- Hồi quy tuyến tính, hồi quy logistic, và các mô hình thống kê khác.
- Phân tích dữ liệu để tìm ra các xu hướng, mẫu hình (patterns), và các quan hệ giữa các biến.
- Các Dự án và Ứng dụng Thực tiễn:
- Cách áp dụng kiến thức thống kê và trực quan hóa dữ liệu vào các dự án thực tế.
- Các ví dụ từ phân tích tài chính, khoa học xã hội, kinh tế, y học, v.v.
- Các Chủ đề Nâng cao (tùy vào cuốn sách):
- Thống kê Bayes (Bayesian statistics).
- Học máy (Machine Learning) kết hợp với thống kê và trực quan hóa.
Cuốn sách sẽ cung cấp cả lý thuyết lẫn các bài tập thực hành giúp người đọc áp dụng những kiến thức này vào phân tích dữ liệu thực tế.
Link sách: https://drive.google.com/file/d/1swoOfVyzQu8loqGrTa9xhAkQygZFaA84/view?usp=sharing
Khóa học Data analytics tại Robiztech vớiPhương pháp học Learning Based Projects
👉Đáp ứng 100% thực tế công việc
🌟Đặc quyền học viên:
🔹 Học thực chiến với dữ liệu thực tế từ doanh nghiệp
🔹 Giảng viên hỗ trợ xuyên suốt quá trình học đến khi có job
🔹 Học lại miễn phí không giới hạn số lần
Khóa học Power BI luyện thi chứng chỉ Microsoft PL_300 lộ trình 18 buổi hiện ƯU ĐÃI còn 3.800.000.
Xem feedback của học viên tại: https://web.facebook.com/robiztechacademy/posts/122140898774115121
100% học với giảng viên: https://robiztech.com/category/doi-ngu-giang-vien/
Miễn phí định hướng 30p về khóa học Data analytics với giảng viên tại đây: https://robiztech.com/lien-he/