Như dự đoán cho UEFA Euro 2024 được xây dựng, thế giới bóng đá háo hức chờ xem đội nào sẽ mang cúp về nhà. Một nhóm các nhà nghiên cứu—Florian Felice, Andreas Groll, Lars Magnus Hvattum, Christophe Ley, Gunther Schauberger, Jonas Sternemann, Achim Zeileis—đã tận dụng sức mạnh của máy học để dự đoán kết quả của giải đấu danh giá này. Nghiên cứu toàn diện của họ sử dụng một nhóm máy học để dự đoán kết quả với độ chính xác cao hơn.

Phương pháp nghiên cứu dự báo

KHAI THÁC. Thu thập dữ liệu

Các nhà nghiên cứu bắt đầu bằng cách thu thập dữ liệu sâu rộng về các trận đấu tại Giải vô địch châu Âu trước đây của UEFA. Bộ dữ liệu này bao gồm kết quả trận đấu, số liệu thống kê của đội, số liệu hiệu suất của người chơi và các yếu tố liên quan khác từ các giải đấu trước. Ngoài ra, họ còn tích hợp dữ liệu hiện tại của đội, chẳng hạn như kết quả trận đấu gần đây, phong độ cầu thủ và thành phần đội để đảm bảo mô hình phản ánh thông tin mới nhất.

2. Kỹ thuật tính năng

Kỹ thuật tính năng là một bước quan trọng trong quy trình của họ, cho phép họ trích xuất các biến có ý nghĩa từ dữ liệu thô. Các tính năng chính được xem xét trong mô hình bao gồm:

  • Các chỉ số sức mạnh của nhóm, chẳng hạn như Bảng xếp hạng FIFA và xếp hạng Elo.
  • Thành tích lịch sử ở giải đấu UEFA.
  • mới đây số liệu hiệu suất, bao gồm tỷ lệ thắng/thua và chênh lệch mục tiêu.
  • Số liệu thống kê dành riêng cho cầu thủ, chẳng hạn như số bàn thắng ghi được, đường kiến ​​tạo và hành động phòng ngự.

3. Lựa chọn mô hình

Để nâng cao độ chính xác cho dự đoán của mình, các nhà nghiên cứu đã sử dụng một phương pháp tiếp cận tổng hợp, kết hợp nhiều mô hình học máy. Các mô hình chính được sử dụng trong nhóm của họ bao gồm:

  • Rừng ngẫu nhiên: Một mô hình linh hoạt nắm bắt các tương tác phức tạp giữa các biến.
  • Máy tăng cường độ dốc (GBM): Hiệu quả để cải thiện độ chính xác của dự đoán bằng cách tập trung vào các trường hợp khó dự đoán.
  • Mạng thần kinh: Có khả năng phát hiện các mẫu phức tạp trong dữ liệu.

Bằng cách kết hợp các mô hình này, tập hợp sẽ tận dụng được điểm mạnh của từng mô hình, tạo ra một hệ thống dự đoán mạnh mẽ và đáng tin cậy hơn.

4. Đào tạo và xác nhận mô hình

Mô hình tập hợp được huấn luyện bằng cách sử dụng dữ liệu lịch sử từ Giải vô địch châu Âu UEFA trước đây. Để xác thực hiệu suất của mô hình, các nhà nghiên cứu đã sử dụng các kỹ thuật xác thực chéo, đảm bảo nó khái quát hóa tốt các dữ liệu chưa được nhìn thấy. Bước này rất quan trọng để tránh trang bị quá mức và để xác nhận rằng mô hình có thể dự đoán chính xác các trận đấu trong tương lai.

5. Dự đoán và phân tích

Với mô hình được đào tạo, các nhà nghiên cứu đã mô phỏng Giải đấu UEFA Euro 2024 nhiều lần để tạo dự báo xác suất cho mỗi trận đấu. Cách tiếp cận này không chỉ đưa ra dự đoán cho từng trận đấu mà còn ước tính khả năng mỗi đội vượt qua các giai đoạn và cuối cùng giành chiến thắng trong giải đấu.

Ekran Resmi 2024-06-14 16.25.34.png
Đồ họa có chiều rộng đầy đủ tương tác

Ai sẽ vô địch Euro 2024?

Mô hình tập hợp học máy cho phép mô phỏng tất cả các trận đấu trong giai đoạn vòng bảng, xác định đội nào tiến vào vòng loại trực tiếp và cuối cùng dự đoán đội chiến thắng. Bằng cách chạy các mô phỏng này 100,000 lần, mô hình tạo xác suất chiến thắng cho mỗi đội.

Ekran Resmi 2024-06-14 16.25.23.png
Đồ họa có chiều rộng đầy đủ tương tác

Kết quả chỉ ra rằng Pháp được yêu thích để giành chức vô địch châu Âu, với xác suất chiến thắng là 19.2%. Anh theo sau với tỷ lệ 16.7%, còn chủ nhà Đức là 13.7%. Biểu đồ thanh bên dưới minh họa xác suất chiến thắng của tất cả các đội tham gia, với thông tin chi tiết hơn có sẵn trong phiên bản tương tác có chiều rộng đầy đủ.

Những phát hiện chính

Nhóm học máy đã tạo ra một số thông tin chi tiết quan trọng:

  • Yêu thích và yếu thế: Mô hình này nêu bật các cường quốc bóng đá truyền thống là những đối thủ mạnh, đồng thời xác định những chú ngựa đen tiềm năng có thể khiến người hâm mộ ngạc nhiên.
  • Trận đấu quan trọng: Một số trận đấu ở vòng bảng và vòng loại trực tiếp được xác định là then chốt, với kết quả có thể ảnh hưởng đáng kể đến diễn biến của giải đấu.
  • Tác động của người chơi: Hiệu suất của từng cầu thủ, đặc biệt là từ các vị trí chủ chốt, được chứng minh là có tác động đáng kể đến kết quả trận đấu.

Kết luận

Công việc của Florian Felice, Andreas Groll, Lars Magnus Hvattum, Christophe Ley, Gunther Schauberger, Jonas Sternemann và Achim Zeileis chứng tỏ khả năng mạnh mẽ của học máy trong việc dự báo kết quả của các sự kiện phức tạp như UEFA Euro 2024. Cách tiếp cận tổng thể của họ, kết hợp nhiều mô hình học máy khác nhau, cung cấp một hệ thống dự đoán mạnh mẽ và chính xác, cung cấp những hiểu biết sâu sắc có giá trị về kết quả tiềm năng của giải đấu.

Thông Tin