Con đường trở thành nhà Khoa học dữ liệu
(Theo chuyên gia tư vấn năng lực ngành Data – Rassul Fazelat)
Những người đọc bài viết của tôi về “Tại sao Kỹ sư dữ liệu không phải là Nhà khoa học dữ liệu?”, đã thúc đẩy tôi viết bài tiếp theo này. Tôi cũng gặp rất nhiều sinh viên rất thông minh ở trường luôn hỏi tôi rằng chuyên ngành nào sẽ đưa họ vào con đường sự nghiệp đúng đắn để trở thành Nhà khoa học dữ liệu?
Chúng ta hãy bắt đầu cuộc thảo luận một cách ngắn gọn và cách tôi xác định một Nhà khoa học dữ liệu hiện đại và các thuộc tính (3), tạo ra một thuộc tính tốt, đó là:
1) Nền tảng phân tích
2) Kinh nghiệm với các công cụ
3) Phân tích và trình bày
Vì vậy, dựa trên các thuộc tính này, bạn có thể thấy rằng trọng tâm của chúng tôi cho bài đăng này sẽ xác định cách xây dựng các thuộc tính (1) và (2). Cách tốt nhất để tôi xem xét các tiêu chí này là thực sự xem chương trình giảng dạy cho hầu hết các chương trình đại học và liên hệ chúng với “cốt lõi” của màn hình kỹ thuật Khoa học dữ liệu. Rõ ràng để xây dựng nền tảng này là xem xét các chuyên ngành tập trung phân tích, hoặc đó có thể là một tấm bằng đại học tốt.
Các kiến thức tiên quyết để trở thành nhà Khoa học dữ liệu có thể được tóm tắt như sau:
Toán / Lý thuyết thống kê
- Lasso & Ridge Regression
- Multiple Imputation
- Cross Validation
- Bootstrapping
- Pruning
- Multi-Nomial Logistic Regression
- Time Series
- K-means
- Bayesian Theory
- Fuzzy Logic
Thiết kế hệ thống / Lập trình dữ liệu lớn
- Hadoop/HDFS
- Apache Spark or Apache Flink
- NLP/Ontology
- Java, and/or Scala or other JVM
- R
- SAS
- MatLab
- SPSS
- SQL
- C, C++
- Python
- PIG (Latin)
Những kiến thức chuyên ngành này chính là nền tảng khởi đầu tuyệt vời cho nhà Khoa học dữ liệu và đang được áp dụng tại trong các chương trình đào tạo của các đại học lớn trên toàn thế giới. Với những kiến thức chuyên ngành trên, học viên tốt nghiệp có thể lựa chọn các định hướng sau:
- Toán, Toán ứng dụng hoặc Thống kê
- Kỹ thuật dựa trên toán học / tính toán
- Khí tượng học hoặc Vật lý thiên văn hoặc Vật lý
- Hóa học (đặc biệt là Hóa lý)
- Thống kê Sinh học
- Khoa học máy tính
- Tư vấn và đánh giá Kinh tế
Bây giờ đây là những nền tảng tuyệt vời cho bằng Cử nhân, nhưng hầu như tất cả các nhà tuyển dụng đều muốn nhìn thấy ở mức tối thiểu, như bằng Thạc sĩ hoặc cao hơn. Một khảo sát gần đây của IDC, cho thấy 22% trong số tất cả các mô tả công việc của các nhà khoa học dữ liệu liệt kê bằng tiến sĩ như một tiêu chí bắt buộc. Theo kinh nghiệm của riêng tôi, tấm bằng tiến sĩ không làm cho bất cứ ai trở thành một Nhà khoa học dữ liệu tốt hơn, nhưng chắc chắn sẽ hỗ trợ họ rất nhiều trong công việc. Các bằng cấp cao hơn hiện đang được ưu tiên do kỷ nguyên Dữ liệu lớn bắt đầu từ năm 2012, do đó, thật khó để so sánh các ứng cử viên Khoa học Dữ liệu dựa trên kinh nghiệm của họ. Có một vài người ngoài kia có bằng tiến sĩ với kinh nghiệm làm việc tuyệt vời (hơn 6 năm), nhưng họ là chỉ là thiểu số. Vì vậy, hiện tại, tiến sĩ và thạc sĩ được coi là ứng cử viên hàng đầu và được ưu tiên tuyển dụng tại các tập đoàn lớn
Tóm lại, tôi hy vọng bài đăng này đã làm rõ thêm con đường trở thành nhà khoa học dữ liệu của những chuyên gia dữ liệu hay các em học sinh đang băn khoan trong chọn trường để có thể bước vào lĩnh vực “hot” này trong tương lai. Trong suốt quá trình học tập và làm việc với các công cụ Dữ liệu lớn, “thuần thục các kỹ năng mềm” gần như cũng trở thành bắt buộc. Chẳng ai muốn trở thành người thông minh nhất trong phòng họp nhưng không thể làm cho mọi người hiểu được ý tưởng mà mình đang trình bày hay tin tưởng các quyết định dựa trên những phân tích dữ liệu của chính mình.
Chúc các bạn trở thành nhà khoa học dữ liệu thành công!
Nguồn: Marketing Distillery
Trở thành sinh viên trường đại học công lập quốc tế để có những trải nghiệm học tập tuyệt vời!
Viện Nghiên cứu và Đào tạo Việt – Anh (VNUK), Đại học Đà Nẵng tự hào là cơ sở giáo dục ĐẠI HỌC CÔNG LẬP QUỐC TẾ được thành lập theo thỏa thuận hợp tác giữa hai chính phủ Việt Nam và Vương quốc Anh.
VNUK (mã trường: DDV) đang xét tuyển các ngành đào tạo như sau:
- Quản trị và Kinh doanh quốc tế (mã ngành: 7340124)
- Khoa học và Kỹ thuật máy tính (mã ngành: 7480204)
- Khoa học Y sinh (mã ngành: 7420204)
- Khoa học Dữ liệu (mã ngành 7480205DT)
Trong đó, ngành Khoa học Dữ liệu là một lĩnh vực rộng mở, mang đến nhiều phát triển trong tương lai. Chương trình tập trung vào tầm nhìn và bối cảnh toàn cầu, giúp sinh viên hội nhập nhanh chóng với các môi trường đa văn hóa, nắm được các kiến thức công nghệ thông tin, dữ liệu mới nhất. Bên cạnh kiến thức nền hiện đại và thường xuyên cập nhật, sinh viên được tạo cơ hội để tham gia giải quyết những vấn đề thực tiễn trong suốt quá trình học.
Sinh viên ngành Khoa học Dữ liệu không chỉ được giảng dạy bởi nhiều chuyên gia giàu kinh nghiệm đến từ các doanh nghiệp mà còn được tham gia nhiều chương trình học tập thực tế như tham quan công ty, các dự án, cuộc thi công nghệ, thực tập ngay từ năm nhất…
————————————————————————————————————————–
Mọi thắc mắc xin vui lòng liên hệ theo địa chỉ:
Viện Nghiên Cứu và Đào Tạo Việt – Anh
158A Lê Lợi, Q.Hải Châu, TP. Đà Nẵng
Hotline: 0905 55 66 54
Số điện thoại: 0236 37 38 399