bg_header

Mã QR đăng nhập App

ico
Tìm kiếm

Data Crawler

icon

Mức lương

18.000.000 VNĐ

icon

Địa điểm

Hồ Chí Minh

icon

Hạn nộp

03/07/2026

icon

Kinh nghiệm

Hơn 1 năm

Công ty
Công ty
icon_mota

Mô tả công việc

- Chuyên viên phát triển hệ thống thu thập dữ liệu cần có khả năng vận hành hệ thống thu thập dữ liệu quy mô lớn, đảm bảo độ ổn định, chính xác và hiệu quả trong công việc.
- Xây dựng và cải tiến hệ thống khai thác dữ liệu dựa trên nền tảng Python, thiết kế các script crawling đa nền tảng phù hợp với nhiều hệ điều hành khác nhau.
- Phát triển các giải pháp crawling song song để xử lý khối lượng dữ liệu lớn và quản lý các luồng dữ liệu đa luồng, sử dụng các công nghệ như Scrapy, BeautifulSoup, Selenium, Asyncio, Multiprocessing.
- Quản lý việc sử dụng proxy, IP rotation để tránh bị chặn và duy trì hoạt động liên tục của hệ thống thu thập dữ liệu.
- Xử lý dữ liệu sau thu thập bằng các quy trình làm sạch dữ liệu qua API, phát triển các thuật toán chuyển đổi dữ liệu, kiểm tra tính toàn vẹn của dữ liệu và loại bỏ dữ liệu nhiễu.
- Sử dụng các công cụ như Pandas, kỹ thuật xác thực dữ liệu, chuẩn bị dữ liệu cho Machine Learning để đảm bảo dữ liệu đầu ra đạt chuẩn.
- Quản lý cơ sở dữ liệu và hệ thống Big Data, tối ưu hóa hiệu suất truy vấn SQL, quản lý NoSQL và PySpark, xây dựng hệ thống kho dữ liệu phù hợp.
- Theo dõi, xử lý các vấn đề phát sinh trong quá trình vận hành hệ thống như chặn IP, giới hạn tốc độ truy cập, CAPTCHA để duy trì hoạt động liên tục của hệ thống thu thập dữ liệu.
- Chịu trách nhiệm quản lý và vận hành hệ thống scraping, theo dõi hiệu suất và xử lý các thách thức liên quan đến IP blocking, tốc độ truy cập và CAPTCHA.
icon_quyenloi

Quyền lợi

- Người lao động sẽ được hưởng đầy đủ các chế độ bảo hiểm xã hội, bảo hiểm y tế, hợp đồng lao động, ngày nghỉ phép theo quy định của nhà nước cùng các quyền lợi khác.
- Công ty hỗ trợ tiền gửi xe hoặc phụ cấp gửi xe cho nhân viên.
Nhân viên sẽ được tăng lương định kỳ hàng năm để phản ánh năng lực và kết quả công việc.:
- Tham gia các khóa đào tạo và phát triển năng lực phù hợp với yêu cầu công việc và lộ trình thăng tiến trong công ty.
- Được tham gia các khoá học cần thiết để nâng cao kỹ năng và kiến thức chuyên môn.
- Nhận thưởng theo tuần, tháng, quý, năm hoặc theo dự án, nhằm ghi nhận thành tích và đóng góp của nhân viên.
- Nhận thưởng lễ, Tết theo chính sách của công ty trong các dịp lễ lớn của năm.
- Làm việc trong môi trường trẻ trung, thân thiện, năng động, phù hợp với các nhân viên có thái độ cầu tiến.
- Có cơ hội đi công tác, du lịch công ty trung bình 1 lần mỗi năm.
icon_yeucau

Yêu cầu

- Ứng viên có bằng cử nhân các ngành Data Science, Computer Engineering hoặc các lĩnh vực liên quan đến dữ liệu, có GPA trên 3.0.
- Tiếng Anh trình độ TOEIC trên 700 hoặc IELTS trên 5.5 để hỗ trợ kỹ năng giao tiếp và đọc hiểu tài liệu kỹ thuật.
- Có kỹ năng sử dụng hệ sinh thái Python, thành thạo Asyncio, Multiprocessing, kỹ thuật làm sạch dữ liệu, tiền xử lý Machine Learning, xử lý lỗi nâng cao.
- Có khả năng quản lý và tối ưu SQL ở mức trung cấp đến nâng cao, có kinh nghiệm làm việc với các hệ quản trị Big Data như NoSQL, PySpark, hệ thống kho dữ liệu.
- Có ít nhất 1-2 năm kinh nghiệm trong các dự án thu thập dữ liệu web, xử lý dữ liệu tự động và các dự án khai thác dữ liệu lớn.
- Kỹ năng phân tích hệ thống, giải quyết vấn đề, làm việc độc lập và theo nhóm, quản lý thời gian và tư duy logic tốt.
- Có thể làm việc hiệu quả dưới áp lực và xử lý các tình huống phát sinh trong quá trình vận hành hệ thống thu thập dữ liệu.
- Các kinh nghiệm về Big Data, thiết kế pipeline dữ liệu, làm việc với các API đa dạng, chứng chỉ chuyên môn và sáng tạo đề xuất ý tưởng là lợi thế.

Hơn 1 năm kinh nghiệm

Đại học trở lên

Giới tính: Không yêu cầu

Độ tuổi: Từ 22 đến 29 tuổi

Thông tin công việc

icon

Lượt xem

994

icon

Chức vụ

Nhân viên

icon

Bằng cấp

Đại học trở lên

icon

Số lượng cần tuyển

1 người

icon

Hình thức làm việc

Toàn thời gian cố định

icon

Thời gian thử việc

2 tháng

icon

Cập nhật

03/06/2026 (21 ngày trước)

icon_nn

Ngành nghề

icon_lv

Lĩnh vực

icon_diadiem

Địa điểm làm việc

Tỉnh thành:

Hồ Chí Minh

Quận huyện:

Quận Phú Nhuận

Địa chỉ chi tiết:

19 Hồ Văn Huê, P9, Quận Phú Nhuận
icon_hoso

Hồ sơ bao gồm

CV + Link github
icon

Cách thức ứng tuyển

Ứng viên nộp hồ sơ trực tuyến bằng cách bấm tại đây.


Hạn nộp hồ sơ: 03/07/2026

icon

XU HƯỚNG 2026

Tổng hợp mẫu CV xin việc Online đẹp nhất

Nâng tầm hồ sơ sự nghiệp với bộ sưu tập mẫu CV tinh tế, chuẩn editorial, được thiết kế để gây ấn tượng mạnh với nhà tuyển dụng ngay từ cái nhìn đầu tiên.

Tạo CV ngay icon
icon

Hơn 50,000+ ứng tiên đã tin dùng

banner cv

icon Lĩnh vực:

thiết kế web

icon Người liên hệ:

Công Ty Cổ Phần Webify Group

icon Địa chỉ:

19 Hồ Văn Huê, P9, Phú Nhuận, Thành phố Hồ Chí Minh

VIỆC LÀM ĐỀ XUẤT BỞI AI365

Quét mã QR chat ngay NTD

ỨNG TUYỂN BẰNG QR

Tìm việc làm liên quan