GIỚI THIỆU BA SẢN PHẨM TỐT NGHIỆP CỦA INTELLIGENCE PROGRAM 2017

April 15, 2018

Khi cả thế giới đang đòi hỏi nguồn lực phát triển sản phẩm áp dụng công nghệ cao, Việt Nam được đánh giá là mảnh đất nhân sự kỹ sư màu mỡ bởi lực lượng lao động trẻ dồi dào có nền tảng tư duy thuật toán và lập trình tốt. Thế nhưng, vẫn tồn tại sự trái ngược giữa nhu cầu thị trường với tư duy giáo dục, định hướng của nước nhà còn đặt nặng tính lý thuyết công nghệ đơn thuần. Những hạt giống tài năng đang phải tự mình loay hoay để được “ươm mầm” đúng cách. Giáo dục văn hóa áp dụng nền tảng công nghệ phát triển tư duy nghiên cứu sản phẩm không những giúp Việt Nam đào tạo được đội ngũ kỹ sư cạnh tranh tiêu chuẩn quốc tế, mà còn sản sinh lực lượng lao động chất lượng đem lại nhiều giá trị cho sản phẩm cho thị trường.

 

Thấu hiểu khó khăn trên con đường vươn tầm quốc tế này, Cinnamon AI Labs đã tổ chức khóa học Intelligence – Chương trình đào tạo kỹ sư AI tài năng trẻ quốc gia. Chương trình được thiết kế như một lộ trình đào tạo dựa trên tư duy phát triển sản phẩm thực tiễn, tự tin với các bài toán thị trường. Sau 6 tháng, những bạn học viên xuất sắc nhất của Intelligence đã có thể tự nghiên cứu ra 3 sản phẩm giải quyết nhu cầu của thị trường và có tiềm năng tạo sức ảnh hưởng lớn tới nhiều ngành công nghiệp.

 

1. Sản phẩm Trợ lý ảo đa ngôn ngữ – Lily Chatbot (Multilanguage Scheduling Assistant)

 

Năm 2016 là một năm bùng nổ của Chatbot với sự vào cuộc ồ ạt của những doanh nghiệp tên tuổi như Facebook, LINE, Slack. Tại Việt Nam, nhiều sản phẩm cũng bắt đầu được thử nghiệm, chủ yếu là Chatbot trên nền tảng tin nhắn Facebook và Website, giúp người dùng tra cứu dịch vụ hay nộp đơn tuyển dụng. Yêu cầu cơ bản nhất của sản phẩm là đảm bảo khả năng giao tiếp tự nhiên, hiểu chính xác ý định phức tạp của người dùng. Khác với các phần mềm trên thị trường thường chỉ biết từ một đến hai ngôn ngữ, Lily Chatbot ra đời với khả năng trò chuyện đa ngôn ngữ, tốc độ xử lý nhanh chóng hơn với công nghệ CNN – Convolutional Neural Network (mạng noron nhân tạo tích chập).

 

Lily Chatbot là một trợ lý ảo đa ngôn ngữ giúp người dùng đặt lịch họp. Hãy tưởng tượng trung bình một nhân viên mất 3 phút để hẹn lịch với một người, mất 300 phút để giao tiếp với 100 người có lịch hẹn khác nhau. Với phần mềm tự động, qua nền tảng tin nhắn thân thiện, vẫn mất 3 phút để hẹn lịch một người, nhưng chỉ mất 3 phút để cùng lúc hẹn 100 lịch khác nhau cho 100 người. Ngoài hiệu suất tăng 10000%, Chatbot còn đảm bảo tính chính xác tuyệt đối và kịp thời của một hệ thống tự động.

 

Chu trình từ lúc người dùng giao tiếp đến khi nhận được câu trả lời diễn ra như sau: Người dùng gửi tin nhắn -> Máy phát hiện ngôn ngữ của câu thoại -> Máy tách tiền xử lý nghĩa của câu -> Sử dụng công nghệ CNN để phân loại nội dung câu (Chào hỏi/ xác nhận thời gian/ từ chối cuộc hẹn/ thay đổi cuộc hẹn…) -> Chắt lọc thông tin cốt lõi cần xử lý (Ví dụ: Câu hẹn lịch thời gian: Chắt lọc nội dung về thời gian) -> Xử lý thông tin và trả lời yêu cầu -> Tiếp tục nhận câu thoại tiếp theo từ người dùng.

 

 

Lily được phát triển từ công nghệ CNN – Convolutional Neural Network (Mạng noron nhân tạo dùng tích chập) để phân loại các ý kiến, GloVe – Global Vectors for Word Presentation (thư viện vector hóa từ vựng – phần mềm phát triển bởi Đại học Standford) để xác định biểu diễn vector của các từ, chỉ cần có một lượng văn bản theo ngôn ngữ đang dùng đủ lớn, RNN – Recurrent Neural Network (mạng noron hồi quy) để chia tách các cụm từ và tìm kiếm thông tin cần chắt lọc trong câu.

 

CNN như một mạng noron thần kinh não người, mỗi điểm trong mạng noron đều là một bảng ma trận được xử lý thông tin đồng thời. CNN truyền tin giữa các tầng bằng tích chập rời rạc các ma trận với bộ lọc, nhanh hơn nhiều so với việc nhân nhiều tầng ma trận với từng vector biểu diễn từ theo từng bước dùng RNN (mạng neuron hồi quy). Vì vậy, thông tin được xử lý nhanh chóng, giảm chi phí vận hành. Bộ lọc thông tin của chatbot được phát triển dựa trên bộ công cụ Stanford NLP – Natural Language Processing (Xử lý ngôn ngữ tự nhiên), để tách và hiểu thông tin thời gian, tách tên và một số thông tin khác được lọc dựa vào việc so sánh với cơ sở dữ liệu của công ty đã được cài đặt.

 

Ý nghĩa thực tiễn

 

Chatbot có thể giúp doanh nghiệp cắt giảm chi phí và thời gian cho bộ phận nhân sự hành chính, tăng năng suất lao động. Lily Chatbot đa ngôn ngữ là phần mềm lý tưởng cho các công ty muốn mở rộng tới nhiều thị trường nước ngoài mà bớt tốn nguồn lực tuyển dụng và đào tạo nhân sự sử dụng tiếng bản địa.

 

Được đào tạo xử lý ngôn ngữ tự nhiên, Chatbot mang đến khách hàng trải nghiệm thân thiện và nhiệt tình trên nền tảng phổ biến tin nhắn mạng xã hội: Facebook Messenger, Skype, LINE, Slack, Viber.

Công nghệ CNN giúp phần mềm xử lý thông tin nhanh dù không tốn kém đầu tư, mô hình dùng GloVe và dùng CNN có thể được triển khai với nhiều ngôn ngữ khác nhau, mục đích khác nhau, chỉ cần có lượng văn bản dữ liệu đủ lớn.  Vì vậy phần mềm này có thể áp dụng rộng rãi trên các các doanh nghiệp kể cả vừa và nhỏ tại Việt Nam, hay mở rộng thêm nhiều ngôn ngữ hoặc trở thành trợ lý đặt lịch hẹn cho cá nhân.

 

2. Tự động trích xuất thông tin hộ chiếu (Passport Auto-extract Information)

 

Với xu hướng tinh giản bộ máy hành chính, doanh nghiệp có nhu cầu lớn trong việc số hóa các dữ liệu (thông tin người dùng, nhân viên), giấy tờ (hóa đơn, hợp đồng), đặc biệt trong các ngành dịch vụ, kế toán, hành chính nhân sự. Các công cụ hiện nay dùng để lưu trữ thông tin từ thẻ căn cước, giấy tờ đều có nhiều khuyết điểm. Viết tay, nhập bằng máy tính: mất thời gian, chưa đảm bảo thông tin chính xác. Dùng máy chụp ảnh hoặc máy scan: chỉ lưu được văn bản dưới dạng file ảnh, không thành file excel tự động lưu trữ thông tin.

 

Trước thực trạng đó, nhóm sinh viên đã có ý tưởng phát triển một phần mềm trích xuất thông tin từ văn bản. Chỉ một thao tác chụp ảnh bằng điện thoại, phần mềm sẽ tự trích xuất thông tin cần thiết và tự cập nhật vào hệ thống dữ liệu. Sản phẩm được thử nghiệm với văn bản hộ chiếu.

 

Phần mềm sử dụng công nghệ Computer Vision (Thị giác máy tính), theo chu trình như sau:

 

 

Công nghệ giúp phần mêm xác định được trang thông tin hộ chiếu ngay cả khi bức ảnh có nhiều vật thể khác. Trong trường hợp ảnh chụp bị mờ hoặc bóng, thông xin trích xuất có thể không chính xác 100%, sẽ có 1 hệ thống khác đã được học về các quy luật thông tin về ngày sinh, họ tên, số hộ chiếu… để hỗ trợ tự động điều chỉnh thông tin sao cho đúng.

Kế hoạch phát triển trong thời gian gần: Nâng cấp thành một phần mềm ứng dụng di động dành cho ngành Dịch vụ khách sạn. Chỉ cần chụp ảnh hộ chiếu từ điện thoại, phần mềm sẽ tự động lưu trữ và cập nhật thông tin khách hàng vào hệ thống. Khi máy scan cồng kềnh có giá tầm $500 thì phần mềm trên điện thoại này có chi phí cài đặt nhỏ hơn rất nhiều.

 

Kế hoạch phát triển trong tương lai xa: Các thuật toán tiếp tục được phát triển để sản phẩm có thể trích xuất thông tin từ nhiều loại giấy tờ hơn: Thẻ căn cước, chứng minh nhân dân, bằng lái xe, hóa đơn giá trị gia tăng.

 

3. Tự động đánh giá thẩm mỹ Website (Auto Website Aesthetic Evaluation)

 

Bạn có biết, cảm nhận trực quan của khách hàng khi vào website chiếm 60% quyết định của họ có sử dụng dịch vụ của công ty đó hay không. Giữa một biển hàng hóa và dịch vụ, tính thẩm mỹ và bộ nhận diện thương hiệu là cánh cửa đầu tiên dẫn dắt khách hàng biết đến sản phẩm của bạn. Thị trường thiết kế đồ họa đang trở thành xu hướng của thế giới khi mọi người thích truyền tải thông điệp ấn tượng bằng hình ảnh, cảm xúc hơn là những con chữ thông thường. Nhu cầu cao nhưng không phải doanh nghiệp nào cũng có nhân viên hoặc thuê được người thiết kế giỏi, hay chuyện xấu đẹp dựa theo nhiều phần cảm tính chứ không mang tính khách quan.

 

Từ bài toán này, các bạn sinh viên đã nghĩ tới một công cụ tự động đánh giá thẩm mỹ website dựa trên công nghệ Máy học – Machine Learning. Nhóm sử dụng dữ liệu là hàng nghìn mẫu thiết kế website, kết quả trắc nghiệm đánh giá thẩm mỹ trên nhiều tiêu chí từ nhiều người đa dạng bởi lứa tuổi, giới tính, nghề nghiệp. Các yếu tố phân tích được chia tách thành nhiều phần thuộc nhóm hình ảnh bên ngoài đến nhóm cấu trúc HTML của Website.

 

Các tiêu chí đánh giá: Giao diện chung (Kích thước, Tỷ lệ bố cục), Chữ viết (Chiều dài, chiều ngang, mật độ), Màu sắc (Tương phản, Độ bão hòa)… Khi đánh giá bằng trực quan, chúng ta đôi khi có thể quên đi một vài yếu tố. Công cụ này giúp việc đánh giá không bỏ qua yếu tố kết cấu nên tính thẩm mỹ nào, tăng tính khách quan của kết quả.

 

 (Máy phân tích từng cụm trên giao diện hình ảnh của website)

 

Các yếu tố đó được biểu diễn thành những vector đặc trưng của từng trang web. Kĩ thuật máy học – Machine Learning sẽ giúp phân loại những vector này một cách tối ưu nhất, từ đó đưa ra được những mô hình, bộ luật hiệu quả để đánh giá tính thẩm mĩ của một trang web.

 

Kế hoạch phát triển trong thời gian gần: ứng dụng vào các công cụ thiết kế web, giúp phát hiện được những sai lầm trong thiết kế, đưa ra gợi ý thay đổi cho người dùng, từ đó cải thiện kết quả thiết kế.

Kế hoạch phát triển trong tương lai xa: Từ dữ liệu đánh giá thẩm mỹ này, công cụ sẽ được mở rộng và huấn luyện để có thể thiết kế tự động mà không cần đến con người. Đó sẽ không chỉ là một cú hích cho ngành thiết kế đồ họa mà còn trong những ngành công nghiệp khác như truyền thông và marketing.

 

Ý nghĩa chung

 

Các kỹ sư trẻ đầy tham vọng tạo ra những sản phẩm có thể ứng dụng rộng rãi mà không đòi hỏi đầu tư quá nhiều nguồn lực khi áp dụng, đem công nghệ thông minh tới mọi doanh nghiệp. Trợ lý ảo là một cuộc cách mạng thay đổi phong cách làm việc của con người trong giao dịch và ngành dịch vụ. Trích xuất thông tin từ thao tác chụp ảnh giấy tờ giảm nhẹ những công việc hành chính, hệ số hóa dữ liệu đồ sộ của doanh nghiệp. Đánh giá thẩm mỹ website tự động sẽ là một cú hích trong thời đại khi con người có xu hướng thích truyền tải thông điệp ấn tượng bằng hình ảnh, cảm xúc thay vì cách làm văn bản như thông thường. Những sản phẩm có hàm lượng công nghệ cao này cao sẽ giúp nhiều doanh nghiệp gia tăng năng suất lao động và sản xuất. Đầu tư vào sản phẩm công nghệ cao không chỉ cứu Việt Nam khỏi nguy cơ bẫy thu nhập trung bình mà cần được tận dụng trở thành đòn bẩy để cạnh tranh trên thị trường quốc tế khốc liệt.

 

Please reload

Our Recent Posts

Please reload

Archive

Please reload

Tags

Please reload

©2018 by Cinnamon AI Labs