Khoa học dữ liệu – nghề đang hái ra tiền ở Mỹ
Murray Webb, 33 tuổi, tốt nghiệp thạc sĩ về thống kê ứng dụng (applied statistics) tại Trường Đại học Kennesaw (Atlanta, Mỹ), hiện kiếm được 160.000 đô la một năm với công việc chủ yếu là theo dõi phần thông tin về dữ liệu chăm sóc sức khỏe khách hàng cho các bệnh viện. Webb cho biết hằng tuần đều có người đại diện của các công ty cũng như các công ty chuyên cung cấp nguồn nhân lực tìm đến anh và đưa ra các lời mời làm việc như một nhà khoa học dữ liệu (data scientist).
Khác với Murray Webb, Jiong Gao – người từ đầu theo đuổi tấm bằng khoa học dữ liệu và phân tích dữ liệu tại trường Georgia State University với niềm say mê rất đặc biệt – đang háo hức chờ đợi ngày được đi làm. Theo Jiong Gao, khoa học dữ liệu là một công việc quyến rũ nhất trong thế kỷ 21 và nó là mảnh đất việc làm tốt của những người có nền tảng kiến thức về máy tính, thống kê và toán học.
Murray Webb cũng như Jiong Gao là một phần của xu hướng nhân sự mới – khoa học dữ liệu. Đây là thời điểm dữ liệu bùng nổ ở Mỹ khi mà bất cứ doanh nghiệp nào cũng muốn sở hữu nguồn dữ liệu có giá trị giúp họ hái ra tiền nhưng lại không muốn vướng vào tấm lưới nhùng nhằng, phức tạp về các quy định còn đang tranh cãi về thông tin của người sử dụng… Và cơn sốt tìm kiếm các nhà khoa học dữ liệu ở các công ty thuộc nhiều lĩnh vực kinh doanh chưa bao giờ sôi sục như bây giờ.
Khan hiếm nhà khoa học dữ liệu
Tình trạng khan hiếm nhà khoa học dữ liệu phổ biến đến nỗi người ta có cảm giác rằng đi đâu cũng nghe thấy các yêu cầu tuyển dụng nhà khoa học dữ liệu. Daniel Gutierrez, thư ký tòa soạn của tạp chí inside BIGDATA ở Los Angeles, cho biết có rất nhiều người đang chuyển từ các lĩnh vực như kinh tế học, tâm lý học, toán học… sang khoa học dữ liệu bởi vì họ nhìn thấy lĩnh vực này đang bùng nổ hơn bao giờ hết và họ có nhiều cơ hội để kiếm được nhiều tiền.
Tỷ lệ doanh nghiệp đăng tuyển ứng viên nhà khoa học dữ liệu qua trang web cung ứng nguồn nhân lực Indeed.com đã tăng 75% trong khoảng thời gian từ tháng 1-2015 đến tháng 1-2018. Trong khi tỷ lệ ứng viên tìm các việc làm ở mảng khoa học dữ liệu cũng tăng cao tương ứng lên 65% trong cùng thời điểm. Một hiện tượng mà trang web này gọi là “đặc sản” ở mảng việc làm khoa học dữ liệu là sự gia tăng về số lượt tìm kiếm các ứng viên có khả năng phân tích tâm lý, cảm xúc của một hay nhóm đối tượng khách hàng nào đó (sentiment analysis) – một trong những sự thách thức đối với công nghệ học máy (machine learning). Theo công ty về nhân sự Robert Half Technology, một nhà khoa học dữ liệu thông thường được trả mức lương trung bình ban đầu khoảng 119.000 đô la và sau đó tăng lên ở mức 168.000 đô la. Những người có chứng chỉ hay bằng cấp có liên quan đến ngành khoa học dữ liệu nằm trong nhóm chuyên gia được tìm kiếm nhiều nhất trong lĩnh vực kinh doanh, với một số tiến sĩ khoa học dữ liệu được hưởng mức lương từ 300.000 đô la trở lên.
Jennifer Priestley, Giáo sư ngành khoa học thống kê và khoa học dữ liệu tại Trường Đại học Kennesaw, miêu tả việc ráo riết săn lùng ứng viên dẫn đến tình trạng khan hiếm nhân lực như trên bằng cụm từ “run on the bank”, tạm dịch là sự đổ xô tới đòi rút tiền ở ngân hàng, nghĩa là tất cả doanh nghiệp đều tranh nhau có được những tài năng trong cùng một lĩnh vực, vào cùng một thời điểm.
Cạnh tranh tuyển dụng cũng dựa trên sự khác biệt
Andrew Gardner, một giám đốc cấp cao về học máy ở công ty bảo mật công nghệ thông tin Symantec Corp. (bang Atlanta), nói rằng ít nhất mỗi tuần một lần anh phải tiếp nhận một lượt chào mời anh về làm việc như một nhà khoa học dữ liệu cho một công ty nào đó – một sự chào mời theo kiểu rất tập trung, rất nghiêm túc dù anh cho biết đang có một công việc tại Symantec. Gardner cho rằng để cạnh tranh trong việc thu hút nhân tài cần có sự khác biệt, đặc biệt là với những người có kiến thức chuyên môn và có sự say mê với công việc đó, như anh chàng Jiong Gao vốn đã phải lòng ngành khoa học dữ liệu khi chỉ mới 24 tuổi.
Hiện nay, các công ty đang tìm cách tiếp cận với lực lượng các nhà khoa học dữ liệu trong tương lai thông qua các dự án hợp tác đào tạo với các trường đại học. Công ty Equifax Inc. có trụ sở tại Atlanta là một trong 11 công ty thực hiện các dự án phân tích dữ liệu và quy tắc thống kê với Trường Đại học Cornell trong năm nay. Theo đó, Equifax cung cấp các bộ dữ liệu khổng lồ thông tin nhận dạng cá nhân, qua đó các sinh viên trong dự án xác định xem khách hàng sẽ đặt các ưu tiên chọn mua hàng như thế nào. Ví dụ, người ta sẽ ưu tiên mua nhà trước hay xe hơi hay điện thoại thông minh? Chris Yasko, người đứng đầu đơn vị nghiên cứu khoa học dữ liệu tại Equifax, cho biết mục tiêu của dự án là thiết lập một mối quan hệ làm việc nghiêm túc trong tương lai giữa nhà tuyển dụng và các ứng viên tiềm năng. Nhà tuyển dụng có cơ hội nhận diện những ứng viên sáng giá, phù hợp với công ty và hướng họ theo một mô hình làm việc mà nếu thành công thì công ty sẽ có thêm những chuyên gia giỏi.
Các chuyên gia về khoa học dữ liệu mô tả bầu không khí tuyển dụng nhà khoa học dữ liệu hiện nay ở Mỹ như là Miền Tây hoang dã trong lịch sử nước này – thời điểm khoa học dữ liệu bùng nổ với sự xuất hiện của rất nhiều tài năng về khoa học dữ liệu dù việc định nghĩa về ngành này còn đang tranh cãi, bản mô tả công việc của nhà khoa học dữ liệu còn rất sơ sài và tùy thuộc vào mục tiêu của nhà tuyển dụng, những yếu tố về loại chứng chỉ, bằng cấp mà một nhà khoa học dữ liệu phải có cũng chưa được rõ ràng… Con đường dẫn đến công việc của một người đôi khi chỉ là một sự ngẫu nhiên. Nói theo cách của Jim Sterne, Chủ tịch Hiệp hội Phân tích Kỹ thuật số, là thông thường nếu học toán, bạn sẽ trở thành giáo viên dạy toán và sau đó bạn trở thành nhà địa chất học vì kiến thức của bạn đã giúp tìm ra dầu và sau đó bạn đi đến trung tâm tài chính như Phố Wall, trở thành một nhà đầu tư hoặc cũng có khi là một nhà khoa học dữ liệu.
Greg Boyd, Giám đốc công ty tư vấn Protiviti, cho biết dữ liệu trong quá khứ là nguồn “nhiên liệu” để các giám đốc điều hành báo cáo về hoạt động của công ty và cung cấp kết quả tài chính. Vào thời đó, trách nhiệm cung cấp dữ liệu của công ty được xem là rất quan trọng nhưng trên thực tế thì lại nằm lặng lẽ ở một góc nào đó kém trang trọng trong công ty. Giờ thì khác, những người làm về dữ liệu, đặc biệt là khi họ khoát lên người chiếc áo chuyên gia phân tích dữ liệu, nhà khoa học dữ liệu vì họ là ngôi sao sáng trên bầu trời nhân sự. Vai trò của nhà khoa học dữ liệu luôn được mở rộng và trách nhiệm của lực lượng này là cung cấp cho công ty những dữ liệu có giá trị cao – mà nhờ khai thác nguồn dữ liệu này mà công ty dự đoán các kết quả tiềm năng, giảm thiểu các mối đe dọa tiềm ẩn cho doanh nghiệp đồng thời đạt được sự tăng trưởng doanh thu, lợi nhuận.
CIO.com đã lấy ý kiến của các nhà lãnh đạo ngành công nghệ thông tin, các nhà phân tích công nghiệp, nhà khoa học dữ liệu và nhiều chuyên gia đầu ngành khác về những tố chất, nền tảng kiến thức và kỹ năng phải có của một nhà khoa học dữ liệu như sau:
- Tư duy phản biện (Critical thinking)
- Mã hóa (Coding)
- Toán học (Math)
- Học máy, deep learning, AI (Machine learning, deep learning, Artificial Intelligence)
- Giao tiếp, truyền đạt (Communication)
- Kiến trúc dữ liệu (Data architecture)
- Giải quyết vấn đề và trực giác kinh doanh tốt (Problem solving and good business intuition)
Tờ CIO.com cho rằng khoa học dữ liệu là lĩnh vực việc làm nóng nhất hiện nay và mỗi nhà khoa học dữ liệu là một vị vua. Vị vua này được các công ty trong mọi lĩnh vực có liên quan đến dữ liệu săn lùng, được hưởng rất nhiều sự ưu đãi bên cạnh mức lương cao ngất ngưỡng. Nhưng vị vua này không dễ ngồi lâu trên ngai vàng nếu không giỏi về các kỹ năng, kỹ thuật, giỏi toán, có kỹ năng kể chuyện, hài hước và có trực giác tốt.