Kinh nghiệm đếm số từ để báo giá dịch game tiếng Trung từ các file Excel (.xls, .xlsx)

Blog » Chia sẻ - kinh nghiệm » Kinh nghiệm đếm số từ để báo giá dịch game tiếng Trung từ các file Excel (.xls, .xlsx)

Vấn đề đếm số từ để báo giá khi dịch game / app tiếng Trung đã được Dịch Thuật Phương Đông nói đến ở một số bài viết:

Tuy nhiên, các bài viết đó là nói đến việc lọc các văn bản tiếng Trung từ các file dữ liệu dạng text hoặc dạng có cấu trúc XML hoặc từ các source code mà có thể dễ dàng đọc được bằng các Text Editor như Notepad, Notepad++, Sublime Text,… Còn nếu bạn mở file Excel (.xls, .xlsx) lên bằng các Text Editor thì bạn chỉ thấy nội dung toàn các số 0 và 1. Bài viết này nói về việc làm sao lọc được các text tiếng Trung từ các file Excel.

Mới nghe bạn có thể thắc mắc “Ồ, Excel thì quá ngon rồi, chỉ cần mở excel lên rồi word count là xong”. Điều này chỉ đúng nếu bạn có một vài file excel, mỗi file lại chỉ có một hoặc vài sheet thôi. Còn vào thực tế, khách hàng gửi cho chúng ta một folder với rất nhiều file excel nằm rải rác trong nhiều folder con khác nhau. Số lượng files từ vài trăm đến hàng ngàn files. Nếu bạn mở từng file, soi từng sheet và word count từng cột của sheet để tính được tổng số text cần dịch rồi mới báo giá thì không biết đến bao giờ mới xong.

Ví dụ về một folder với nhiều folder con và files nằm ở nhiều folder khác nhau
Ví dụ về một folder với nhiều folder con và files nằm ở nhiều folder khác nhau

Ngoài ra, nếu khách hàng cam kết sẽ ký hợp đồng với bạn thì việc thống kê này còn có ý nghĩa. Trường hợp làm bở hơi tai ra để báo giá cho khách hàng xong rồi khách hàng lấy cái thống kê đó mang qua công ty khác chốt giá thấp hơn thì thật sự là “muốn bỏ nghề”.

Đây là thực tế mà nhiều công ty dịch thuật ở Việt Nam và cả trên thế giới gặp phải. Để giải quyết vấn đề này, chúng tôi đã thực hiện convert file Excel sang file CSV có thể đọc được bằng các Text Editor rồi sau đó sử dụng công cụ đếm số từ tiếng Trung đã giới thiệu trước đó là xong.

Bước 1: Convert hàng loạt file Excel sang file CSV

Tất cả các file Excel nằm rải rác trong các folders con, folders cháu,… đều được chuyển đổi hàng loạt sang file CSV bằng công cụ mà mình gọi là “Batch convert multiple Excel files to CSV recursive” này. Công cụ này còn có thể convert được tất cả các sheet có trong file Excel thành các file CSV riêng biệt chứ không như nhiều công cụ trên mạng họ chỉ hỗ trợ convert từng file một và chỉ convert sheet đầu tiên.

Convert hàng loạt files Excel từ nhiều folders con khác nhau thành files CSV
Convert hàng loạt files Excel từ nhiều folders con khác nhau thành files CSV

Bước 2: Lọc tiếng Trung từ các file CSV

CSV là file có thể đọc được dễ dàng bằng các Text Editor, do vậy để lọc tiếng Trung từ các file này rất đơn giản. Bởi Dịch Thuật Phương Đông đã có công cụ lọc được text tiếng Trung từ tất cả các file mà khi mở lên bằng Text Editor và ta có thể đọc được.

Lọc và đếm số từ tiếng Trung hàng loạt
Ví dụ folder Excel Data có 378 files excel nằm rải rác trong nhiều folders con, folder cháu,… đã được chuyển thành file CSV. Bây giờ chỉ cần ấn nút Lọc tiếng Trung và đợi 1 lát ta sẽ có đầy đủ file text theo đúng cấu trúc của folder gốc.

Ví dụ:

Folder gốc Excel Data có cấu trúc như sau:

  • Folder 1
  • Folder 2
  • Folder 3
  • Folder 4
  • Folder 5

Thì sau khi ấn nút “Lọc tiếng Trung” ta sẽ được các files:

  • Folder 1.txt
  • Folder 2.txt
  • Folder 3.txt
  • Folder 4.txt
  • Folder 5.txt

Các file txt này chỉ chứa các từ tiếng Trung cần dịch, hoàn toàn không có các chữ latin hay các con số. Do vậy việc đếm từ như này sẽ cực kỳ chính xác và có lợi hơn cho khách hàng.

Tổng hợp text tiếng Trung từ file excel
Đếm số từ tiếng Trung hàng loạt từ các files Excel

Bước 3: Tổng hợp báo giá

Khi đã có đầy đủ, chính xác danh sách các file text chỉ chứa các từ tiếng Trung cần dịch rồi thì báo giá rất đơn giản. Bạn có thể word count từng file rồi điền vào file Excel tổng hợp cũng được. Nhưng Dịch Thuật Phương Đông chỉ cần 01 click để tổng hợp.

Đếm số từ của mỗi file txt và tổng hợp lại thành file báo giá Excel gửi khách hàng.
Đếm số từ của mỗi file txt và tổng hợp lại thành file báo giá Excel gửi khách hàng.

Kết quả là ta có một file tổng hợp như sau:

Báo giá dịch tiếng Trung từ source code
File tổng hợp số lượng từ tiếng Trung từ 378 files Excel, mỗi file lại có vài sheet nằm rải rác trong các folders đã được tổng hợp gọn trong 1 file excel chỉ với vài bước thay vì phải mở từng file lên và đếm thủ công.

Trên đây là kinh nghiệm mà chúng tôi đã thực hiện việc báo giá dịch tiếng Trung cho các loại tài liệu về Game / App. Bạn có cách nào thực hiện đếm từ tốt hơn không? Hãy chia sẻ ý kiến của mình dưới phần bình luận nhé!


Cho đến nay, Dịch Thuật Phương Đông đã nghiên cứu và phát triển ra nhiều công cụ với tính năng chuyên biệt mà các phần mềm trên thế giới chưa đáp ứng được:

Tất cả các công cụ của chúng tôi đều được tối ưu hóa để không gặp phải vấn đề về lỗi font chữ như các phần mềm trên thế giới. Nếu bạn đang có nhu cầu dịch game, dịch App/ Software, dịch website hoặc các tài liệu khác. Đừng ngần ngại, hãy liên hệ ngay với chúng tôi để được tư vấn báo giá tốt nhất.

Mobile/Zalo: 0964.333.933
Email: contact@dichthuatphuongdong.com

5/5 - (20 bình chọn)
Liên hệ dịch tài liệu hoặc tìm phiên dịch viên

Viết một bình luận

16 − 14 =