Bên cạnh tính logic hay các niềm tin vào siêu nhiên thì chiêm tinh, thần số hay sinh trắc học vân tay... được nhiều người quan tâm vì cho rằng các bộ môn này có ít nhiều cơ sở từ khoa học dữ liệu. Nôm na là giống như nếu quan sát một nhóm đủ lớn những người có đặc điểm chung (sinh trong một khoảng thời gian, có kiểu vân tay nào đó giống nhau) thì sẽ có cùng một số đặc điểm về tính cách, vận mệnh... Vậy điều này có đáng tin cậy?
Trước khi tìm hiểu về tính khoa học dữ liệu trong việc giải mã các vì sao, chúng ta cần nắm rõ một chút về điểm mấu chốt của ngành nghiên cứu và phân tích dữ liệu này.
Điểm mấu chốt trong khoa học dữ liệu
Khoa học dữ liệu là một lĩnh vực nghiên cứu kết hợp những nguyên tắc và phương pháp thực hành của nhiều lĩnh vực như toán học, thống kê, trí tuệ nhân tạo và kỹ thuật máy tính để phân tích khối lượng lớn dữ liệu (1). Với mục đích là để giúp con người đặt ra và trả lời những câu hỏi, như là "Sự kiện gì đã xảy ra, tại sao nó xảy ra, điều gì sẽ xảy ra và mục đích là gì?"
Trong khoa học dữ liệu, nhiều người quan tâm đến dữ liệu bởi nó là một khối kiến thức đồ sộ, nhiều khi phải trả giá rất đắt để sở hữu. Cũng không ít "drama" của những gã khổng lồ công nghệ xoay những quanh vấn đề nhạy cảm này (2). Chẳng vậy mà thị trường phân tích dữ liệu đã mở rộng và được định giá tới 271,83 tỷ đô (hơn 6,6 triệu tỷ đồng) vào năm 2022, 307,52 tỷ đô (hơn 7,4 triệu tỷ đồng) vào năm 2023 và được dự báo sẽ "sinh sôi" lên tới 745,15 tỷ đô (hơn 18 triệu tỷ đồng) vào năm 2030 (3).
Thế nhưng, điểm mấu chốt trong "khoa học dữ liệu" không chỉ là dữ liệu mà là khoa học (4). Chính khoa học và kỹ thuật phân tích khối lượng dữ liệu đó mới là thứ mang lại nhiều giá trị cho thị trường này.
Bởi lẽ, dữ liệu tuy khổng lồ nhưng vẫn cần tới một sự đảm bảo rằng chúng có thể được sử dụng để trả lời câu hỏi mà chúng ta đặt ra. Do đó, chúng ta cần tới kiến thức khoa học để xử lý và đặc biệt là phân tích. Bởi vậy, trong nhiều bước như thu thập, tiền phân tích, phân tích, trực quan, mô hình hóa, dự đoán và theo dõi dữ liệu, quan trọng nhất vẫn là 3 yếu tố sau đây:
Phân tích dữ liệu: Việc sử dụng các phương pháp thống kê để trích thông tin từ dữ liệu là trọng tâm của khoa học dữ liệu. Tiến trình này giúp hiểu rõ hơn về xu hướng, mối quan hệ và đưa ra dự đoán.
Trực quan hóa dữ liệu: Khả năng trực quan hóa thông tin là để làm cho dữ liệu trở nên dễ hiểu và tương tác. Biểu đồ và đồ họa giúp trình bày kết quả phân tích một cách rõ ràng và dễ quan sát hơn.
Mô hình hóa và dự đoán: Xây dựng mô hình để dự đoán xu hướng tương lai là một phần quan trọng của khoa học dữ liệu. Nó giúp ứng dụng các kết quả phân tích vào dự đoán và đưa ra quyết định trong thực tế.
Nếu nhìn qua những điểm chính trên, thì bộ môn chiêm tinh cũng khá là liên quan đấy chứ!
Chiêm tinh và khoa học dữ liệu: Vẫn còn một khoảng cách dài
Có rất nhiều bài đăng trên những tờ báo lớn như The Guardian, The Washington Post hay Science Focus về mối quan hệ thú vị giữa khoa học dữ liệu và chiêm tinh (5), (6), (7). Thế nhưng, những bài viết trên đều không đưa ra kết luận rằng có cơ sở khoa học dữ liệu trong chiêm tinh, mà chỉ đưa ra một số đặc điểm liên quan - điều được nhà khoa học Alexander Boxer trình bày trong cuốn sách A Scheme of Heaven: The History of Astrology and the Search for Our Destiny in Data, tạm dịch là Kế hoạch của Thiên đường: Lịch sử chiêm tinh và sự tìm kiếm số phận loài người trong dữ liệu (8).
Alexander Boxer có bằng Tiến sĩ Vật lý tại MIT, bằng Thạc sĩ về Lịch sử Khoa học tại Đại học Oxford (Anh Quốc) và bằng cử nhân Ngôn ngữ Cổ tại Đại học Yale (Hoa Kỳ). Trong thời gian rảnh rỗi, ông là thành viên tích cực của Atlas Obscura - một tạp chí về những điểm đến kỳ dị (9). Ông có lẽ là một trong những trường hợp hiếm hoi mày mò và tìm cách giải thích chiêm tinh dưới góc độ khoa học dữ liệu.
Alexander Boxer lập luận rằng các nhà chiêm tinh là những nhà khoa học dữ liệu vào thời đại của họ (8).
Vì về cơ bản, cách thực hành chiêm tinh cổ xưa có liên quan đến khoa học dữ liệu. Vào thời đó, chiêm tinh gia thu thập thông tin từ một nhóm người (lấy mẫu) và tìm thấy trong đó những đặc điểm giống nhau (phân tích). Sau đó, họ dựa trên những suy luận về sức ảnh hưởng của các hành tinh để giải thích về những hiện tượng khác, như tâm lý con người và vận mệnh (trực quan, mô hình và dự đoán).
Alexander Boxer cũng đồng thời nhấn mạnh rằng các chòm sao không tác động đến chuyện chúng ta thất tình hay trúng số trong tháng, mà ở nhiều khía cạnh khác phức tạp hơn.
Thế nhưng, ở thời đại hiện này, cách làm này không thể được xem là khoa học dữ liệu, vì nằm ở tính khoa học hiện đại của nó. Bởi có thể thấy ngay rằng việc lấy mẫu từ thời xưa còn khá sơ sài, phương pháp phân tích dữ liệu còn hạn chế và việc trực quan cũng như mô hình hóa dữ liệu lại ẩn chứa nhiều vấn đề.
Tuy nhiên, một điểm sáng là nếu trong tương lai, có nhiều nhà khoa học như Alexander Boxer hơn để kết nối chiêm tinh với khoa học dữ liệu thì mối quan hệ này sẽ phần nào được làm sáng tỏ. Nhưng, điều đó không hề dễ dàng, bởi một thực trạng dễ nhận thấy là các chiêm tinh gia thường... không mấy quan tâm đến khoa học dữ liệu.
Tại sao nhà chiêm tinh không áp dụng khoa học dữ liệu nhiều hơn?
Đây là một chủ đề hấp dẫn được nhiều người quan tâm và thảo luận ở nhiều nơi. Trên trang Quora, nó thu hút được nhiều ý kiến trái chiều của độc giả (10). Các câu trả lời có thể tổng hợp thành ba ý như sau:
1. Thiếu nguồn nhân lực: Những nhà chiêm tinh thì không biết đến khoa học dữ liệu và các nhà khoa học dữ liệu cũng chẳng mặn mà gì mấy với chiêm tinh. Do hiếm có người như Alexander Boxer nên việc kết nối hai hệ thống này lại với nhau gần như là... dậm chân tại chỗ.
2. Khó đưa ra kết luận rõ ràng: Thứ nhất, các chiêm tinh gia cần quyền truy cập vào lượng dữ liệu khổng lồ về con người để tiến hành nghiên cứu. Đây là một sự vi phạm quyền riêng tư nghiêm trọng, do đó, ta có thể nói rằng nó "bất khả thi". Thứ hai, việc đưa ra kết luận có thể chỉ là một hành vi "dán nhãn", thiếu chính xác và đóng khung tính cách con người.
Chẳng hạn, nếu các chiêm tinh gia xác định được rằng mỗi người sinh vào ngày x trong tháng y đều có tham vọng, vẫn còn là quá sớm để đi đến kết luận chính xác, bởi đặc điểm "tham vọng" trong trường hợp này có thể chỉ là một biểu hiện hành vi của những nét tính cách phức tạp hơn. Có thể những người này tham vọng vì họ yêu gia đình và muốn có cuộc sống tốt hơn (khía cạnh gốc rễ gia đình), có thể họ có khao khát chứng minh bản thân (khía cạnh bản thân) hoặc họ có bạn bè tốt, luôn hỗ trợ nhau cùng tiến (khía cạnh bạn bè)... Do đó, lời kết luận rằng họ "tham vọng" chính là một sự "dán nhãn" thiếu rõ ràng và không hoàn chỉnh.
3. Cần nhiều thái độ khoa học hơn: Hành vi lý tưởng của một người làm khoa học là luôn nghi ngờ bản thân và tạo đòn bẩy cho sự phát triển. Một phẩm chất làm nên một khoa học gia đúng đắn là nỗ lực tìm ra những khuyết điểm ở bản thân của mình trước rồi mới sửa chữa xã hội sau. Trong khi đó, cố chấp bám vào những "niềm tin thần bí nhiệm màu" là đặc trưng của nhiều người làm chiêm tinh - như một người trong nghề đã chia sẻ (11).
Vậy nên, mặc dù có mối liên quan thú vị và hứa hẹn một tương lai khai mở cho sự tác hợp giữa chiêm tinh học và khoa học dữ liệu nhưng có lẽ phải khá lâu nữa, hai lĩnh vực "oan gia ngõ hẹp" này mới có thể song hành và mang lại nhiều giá trị cộng hưởng đến cho con người.
Comments