Phần mềm nhận diện ‘thủ phạm’ gian lận thi cử
Sau sự cố gian lận thi cử ở Hà Giang, Hòa Bình, Sơn La… trong kỳ thi THPT năm 2018, một nhóm học sinh đã viết ra chương trình sử dụng trí tuệ nhân tạo để nhận diện người viết, dựa vào chữ viết tay.
Đó là nhóm học sinh gồm: Phạm Quốc Trung (lớp 11 Trường THPT chuyên Trần Hưng Đạo, tỉnh Bình Thuận), Lê Kiều Anh (lớp 12 chuyên Anh Trường THPT chuyên Hà Nội – Amsterdam) và Vũ Lê Mai (Trường THPT chuyên Lào Cai, tỉnh Lào Cai).
Đây là 3 học sinh vừa tham gia Trại hè toán và khoa học do Hội Sinh viên VN tại Mỹ phối hợp Trường ĐH Khoa học và công nghệ Hà Nội tổ chức tại Hà Nội. Dưới sự hướng dẫn của các cố vấn là du học sinh ở các trường đại học công nghệ hàng đầu thế giới, 3 học sinh trên đã hoàn thành đề tài nghiên cứu này.
Phạm Quốc Trung, đại diện nhóm nghiên cứu, cho biết từ những sự cố gian lận thi cử ở Hà Giang, Hòa Bình, Sơn La… trong kỳ thi THPT năm 2018, nhóm tạo ra chương trình nhận diện người viết dựa vào chữ viết tay, nhằm giảm các tình huống tương tự. Nhóm đã sử dụng trí tuệ nhân tạo để nhận diện chữ viết và so sánh với các dữ liệu liên quan để phát hiện người viết. “Chỉ cần một chữ viết tay, phần mềm có thể truy tìm được người viết bằng việc so sánh với những dữ liệu có sẵn”, Quốc Trung chia sẻ.
Kể về phương pháp nhận diện, Trung cho biết: Nhóm đã viết ra một phần mềm cắt ảnh chữ viết lớn ra thành những hình nhỏ và chiết xuất ra những đặc trưng của hình nhỏ, rồi đem so sánh trong bộ dữ liệu được thu thập sẵn để nhận diện được người viết.
“Trong đề tài nghiên cứu, nhóm đã thu thập chữ viết của 15 người, mỗi người viết 5 câu và chụp thành 3 bức ảnh lớn. Sau đó, ảnh được đưa vào máy tính và phần mềm sẽ tự động cắt ảnh để đem so sánh với bộ dữ liệu chữ viết của 657 người (trong đó có 15 người nêu trên). Sau khi “đọc vị” những ảnh nhỏ tập trung vào người nào nhiều nhất thì sẽ là chữ viết của người đó. Kết quả phần mềm đã nhận diện đúng chữ viết của 15 người này”, Quốc Trung cho hay.
Quốc Trung cũng ví dụ trong trường hợp bài thi của thí sinh có người khác tác động vào, phần mềm sẽ nhận ra chữ viết “lạ”, đồng thời khi mang chữ viết đó ra phân tích bằng phương pháp trên và đối chiếu với những dữ liệu đã được thu thập của “đối tượng nghi vấn”, sẽ nhận diện ra người viết. Theo Trung, trong tình huống có những người viết giấy nhờ tác động tiêu cực trong thi cử (như trường hợp các mẩu giấy “nhờ xem điểm thi” được phát hiện trong kỳ thi THPT ở Hà Giang vừa qua – NV), chỉ cần thu thập chữ viết, có thể là chữ ký của những đối tượng nghi vấn, đưa vào phân tích sẽ biết người viết là ai.
“Thông thường chữ viết có sự đặc biệt riêng, nên khả năng nhận diện sẽ chính xác tới 94%”, Quốc Trung khẳng định. Trung cũng cho biết việc một người viết nhiều kiểu chữ khác nhau thì sẽ khó so sánh hơn, nhưng vẫn có thể nhận diện được vì dựa theo nét chữ.
Hơn nữa, việc cắt nhỏ chữ viết để đem so sánh sẽ có xác suất cao hơn.
Nhận xét về đề tài này, anh Bùi Đức Lộc, sinh viên Trường ĐH Rochester (Mỹ), một trong những người cố vấn của nhóm nghiên cứu, cho rằng đây là một đề tài nghiên cứu có tính ứng dụng cao vì có thể sử dụng trong đời sống hằng ngày. Đây mới chỉ là bước đầu của dự án và có thể không khó trong lĩnh vực trí tuệ nhân tạo, nhưng ý tưởng của đề tài thì sáng tạo vì chưa nhiều người nghiên cứu. “Đề tài còn mang tính thời sự, có thể phát triển thành phần mềm hoàn thiện để triển khai trên thực tế”, anh Lộc nói.
Nguồn: phan-mem-nhan-dien-thu-pham-gian-lan-thi-cu-1104411.html