Cậu sinh viên chung tay hóa giải nỗi kinh hoàng "chữ bác sĩ"

Cậu sinh viên chung tay hóa giải nỗi kinh hoàng
Tạp chí Nhịp sống số - Một sinh viên từ Đại học RMIT đã giúp giải quyết thách thức rất lớn "ngáng đường" việc số hoá lượng lớn bệnh án tiếng Việt - giải mã chữ viết tay loằng ngoằng khó đọc của bác sĩ.

"Chữ bác sĩ" đã trở thành một nỗi ám ảnh của khá nhiều người, cùng với biết bao giai thoại về hiểu lầm, diễn giải sai chuẩn đoán, y lệnh... khiến bệnh nhân và gia đình cười ra nước mắt. Trong thực tế, chữ viết tay của các bác sĩ đã và đang là một thách thức rất lớn "ngáng đường" việc số hoá lượng lớn bệnh án tiếng Việt tại Việt Nam hiện nay.  

Phùng Minh Tuấn - cậu sinh viên hiện đang học năm cuối tại Khoa Khoa học và Công nghệ, Đại học RMIT Việt Nam - đã chọn vấn đề này để góp phần tham gia số hóa hoạt động chuyên môn trong ngành Y tế. 

Cụ thể, hợp tác với Bệnh viện Bệnh nhiệt đới và Đơn vị Nghiên cứu lâm sàng Đại học Oxford (OUCRU) tại TP. Hồ Chí Minh, Phùng Minh Tuấn đã phát triển thành công một tập hợp đầu cuối để nhận diện chữ viết trên bản quét bệnh án tiếng Việt – công nghệ giàu tiềm năng hỗ trợ việc đẩy mạnh số hoá bệnh án mà Chính phủ triển khai từ năm 2019. 

Nỗi kinh hoàng "chữ bác sĩ" sẽ dần được hóa giải nhờ công nghệ học máy

Phùng Minh Tuấn cho biết: “Đến nay, công nghệ nhận diện chữ viết đã tiến bộ rất nhiều nhưng hầu hết những phương pháp hiện có được phát triển để đọc tiếng Anh và hiện có rất ít hay gần như không có phần mềm riêng cho tiếng Việt”. 

Cùng đó, “Nhận diện chữ viết tay tiếng Việt về cơ bản thách thức hơn với tiếng Anh nhiều vì sự hiện diện của các lớp ký tự, âm điệu và dấu câu phức tạp”, Tuấn cho hay. 

Tuấn đã mất hơn 3 tháng cho quá trình thử-sai-thử để tìm ra cách hiệu quả nhất có thể chuyển hình ảnh của một bệnh án giấy thành phiên bản điện tử.

“Chúng tôi giải quyết những thách thức này bằng cách đẩy mạnh các nhiệm vụ khác nhau trên tập hợp nhận diện chữ viết”, Tuấn nói. 

“Chúng tôi áp dụng quy trình giảm nhiễm, chia nhỏ chữ viết xuống cấp độ từ và áp dụng mô hình ngôn ngữ Bigram để tăng xác suất chỉnh sửa có thể cho những từ xung quanh. Quan trọng hơn là chúng tôi phối hợp và thực hiện một cấu trúc học máy bao hàm mạng lưới thần kinh nhân tạo ResNet để chiết xuất hình dạng chữ và BiLSTM để lên mẫu tần suất chữ, và CTC cho nhiệm vụ sao chép cuối cùng. Tại điểm này, tín hiệu đầu ra cuối cùng dạng chuỗi song hành cùng bộ từ vựng sẽ giúp kết quả chính xác hơn”.

Theo Tiến sĩ Đinh Ngọc Minh- Giảng viên Khoa Khoa học và Công nghệ (Đại học RMIT), đồng thời là thầy trực tiếp hướng dẫn Tuấn, công trình này hứa hẹn mở ra những hướng đi rất khả quan.  Theo đó, tập hợp nhận diện chữ viết có thể đóng vai trò thiết yếu hỗ trợ công cuộc số hoá các cơ sở y tế và bệnh viện ở Việt Nam, giúp họ sẵn sàng hơn trong việc chuyển sang sử dụng hệ thống quản lý bệnh án điện tử hiện đại. 

“Công trình mà Tuấn đề xuất có thể đẩy mạnh quy trình số hoá hệ thống bệnh án” -  Tiến sĩ Minh cho hay - “Với sự trợ giúp của máy móc trong xử lý toàn bộ bệnh án, các cơ sở y tế có thể dần chuyển sang hệ thống điện tử mà không phải thay đổi quy trình đột ngột”.

Phùng Minh Tuấn và giáo viên trực tiếp hướng dẫn - Tiến sĩ Đinh Ngọc Minh (trong hình, bên phải).

“Hệ thống như vậy sẽ còn cho phép các cơ sở y tế ở vùng hẻo lánh hay cán bộ y tế không có điều kiện tiếp cận máy tính tiếp tục với hệ thống giấy tờ hiện tại và có thể số hoá dễ dàng sau đó”. 

Sự sẵn sàng để chia sẻ bệnh án của bệnh nhân giữa các phòng ban, cơ sở y tế sẽ giúp giảm bớt những xét nghiệm không cần thiết và tối ưu hoá điều trị, và dần cải thiện chất lượng chăm sóc y tế. 

“Và quan trọng nhất là công trình của Tuấn có thể tạo nên bộ dữ liệu ghi chép y khoa số hoá cho các giải pháp học máy y khoa tiềm năng khác nhau”, ông nói. “Thực tế, các bên hợp tác cùng chúng tôi là Bệnh viện Bệnh nhiệt đới và OUCRU dự kiến dùng dữ liệu tạo ra được để phát triển hệ thống chuyên gia chẩn đoán, cải tiến quy trình điều trị và giảm thiểu lỗi trong thực hành y khoa”.

Với công trình này, Tuấn đã có được vị trí thực tập tại OUCRU và công trình của bạn còn được thuyết trình tại Hội thảo khoa học quốc tế hạng A - The ACIS2020, Hội thảo AHT, cũng như Triển lãm trực tuyến các công trình của sinh viên RMIT.

Liên quan đến công nghệ nhận dạng chữ viết tay, tại Việt Nam hiện nay đã có không ít công ty nghiên cứu và xây dựng các giải pháp cho phép nhận dạng chữ viết tay và trích xuất các ký tự từ dữ liệu hình ảnh và ứng dụng cho nhiều lĩnh vực như sản xuất, bán hàng, logistics, xác thực chủ thể, quản lý - số hóa tài liệu, etc.. Điển hình như Công ty GMO-z.com Runsystem với phần mềm SmartOCR

 Tuy nhiên, với một sinh viên còn đang trên ghế giảng đường như Phùng Minh Tuấn, việc vận dụng những kiến thức đang học cùng với nỗ lực tự tìm tòi, nghiên cứu để thực hiện nghiên cứu mang giá trị thực tiễn cao là rất đáng trân trọng.

Có thể bạn quan tâm