Apple Intelligence và câu chuyện Apple “đi đầu” về bảo mật dữ liệu khi xử lý AI

Apple Intelligence, cái tên đang chiếm sóng về lượt tìm kiếm trên gần như khắp các nền tảng, có nhiều thông tin thú vị xoay quanh lớp AI mà Apple sẽ nhúng nó vào iOS, iPadOS và macOS sắp tới. Fast Company đã có cuộc phỏng vấn độc quyền Phó Chủ tịch cao cấp Kỹ thuật Phần mềm của Apple là Crag Federighi để hiểu thêm về các biện pháp bảo vệ quyền riêng tư và AI sẽ ảnh hưởng như thế nào đến Apple, người dùng và ngành công nghiệp trong tương lai.

Có một điều cần phải làm rõ, Apple Intelligence hiện tại là nền tảng Generative AI đầu tiên và duy nhất đến hiện tại được thiết kế từ đầu để bảo vệ quyền riêng tư của người dùng. Apple Intelligence có thể biết nhiều về bạn, nhưng Apple sẽ không biết gì cả và Apple Intelligence cũng được thiết kế để Apple không bao giờ làm được chuyện đó (lấy dữ liệu của bạn để huấn luyện AI).

Crag mô tả AI là một làn sóng trong thế giới công nghệ nói chung mà nó sẽ không sớm thoái trào như những trào lưu thông thường khác, AI bây giờ khác với khái niệm mà người dùng biết về AI cách đây tầm 10 năm. AI tổng quát hay Gen AI nó cũng giống như làn sóng chạy đua về chip, nó sẽ chỉ ngày càng nóng hơn, đi nhanh hơn, hay với Apple là iPhone và iMac…

Tổng hợp tất cả các tính năng AI của Apple

Trên iOS 18, iPad 18 và macOS Sequoia mới ra mắt đêm qua, xương sống vận hành hầu hết các tính năng mới chính là AI (Apple gọi đây là Apple Intelligence chứ không phải là Artificial Intelligence như xưa giờ.

Apple tham gia cuộc chơi AI sau Microsoft và sau Google, hai đối thủ lớn nhất của iOS và macOS, Apple Intelligence đến sau Gemini và Copilot, nhưng thay vì là một chatbot, AI của Apple được nhúng vào cả ba nền tảng hệ điều hành lớn nhất mà Apple đang có: iOS, iPadOS và macOS. Điều này cho phép Apple Intelligence hoà trộn và đi vào rất sâu bên dưới hệ điều hành, nó sẽ ở đó bất cứ lúc nào bạn cần và vô hình khi bạn không cần đến nó.

Apple Intelligence được Apple tạo ra để mang tính thân thiện, cá nhân hoá trải nghiệm giữa AI và người dùng, tính dễ sử dụng và đặc biệt là đề cao sự riêng tư, là một thứ gì đó mà những hệ thống AI hay các mô hình ngôn ngữ lớn khác không đề cập một cách cụ thể và chính xác.

Các phương pháp xử lý dữ liệu xung quanh các dịch vụ AI và chatbot là khác nhau và một số trong đó đảm bảo về quyền riêng tư, Apple cũng vậy nhưng Apple lại có một hướng đi khác.

Hiện tại cách xử lý các tác vụ AI sẽ có hai hướng: trực tiếp trên thiết bị và trên cloud, với phần cứng mạnh mẽ trên iPhone, iPad và máy Mac, Apple tất nhiên muốn các tác vụ AI của mình xử lý on-device nhiều nhất có thể, nhưng chắc chắn có những tác vụ mà đòi hỏi sức mạnh xử lý mạnh hơn rất nhiều một chiếc iPhone hay máy Mac có thể làm được. Vì vậy nó sẽ chuyển request của người dùng lên cloud. Với việc xử lý on-device thì dữ liệu của người dùng sẽ chỉ nằm trên máy người dùng, nhưng việc xử lý request của người dùng lên cloud, Apple lại có cách xử lý khác và công khai điều đó.

Cloud của Apple cũng khác so với các dịch vụ AI sử dụng cloud để xử lý, dù là mã nguồn đóng hay mở, các hệ thống máy chủ của Apple được xây dựng dựa trên Apple Silicon, với các nền tảng bảo mật quen thuộc mà người dùng đã biết như Secure Enclave hay Secure Boot, kết hợp chúng với một OS mới là sự kết hợp giữa iOS và macOS để hỗ trợ tốt nhất cho việc suy luận mô hình ngôn ngữ lớn, sự kết hợp này cũng giúp tích hợp được các công nghệ bảo mật tiên tiến của iOS như Code Signing và Sandbox.

PCC của Apple được xây dựng dựa trên nhiều yếu tố, nhưng một trong số đó mà mình muốn đề cập là Stateless, tức là khi Apple Intelligence nhận dược request của người dùng bắt buộc phải sử dụng cloud để xử lý, dữ liệu người dùng được gửi lên hệ thống máy chủ của Apple nhưng nhân viên của Apple sẽ không thể biết được dữ liệu này là gì, ngay cả trong quá trình xử lý. Sau khi xử lý xong request của người dùng, dữ liệu cũng sẽ không được giữ lại, kể cả log.

Các công ty khác cũng nói về điều đó (bảo mật dữ liệu) khi ra mắt các nền tảng Generative AI, nhưng chưa có công ty nào công khai một cách rõ ràng, chi tiết như Apple và thậm chí công khai các image cho các nhà phát triển nghiên cứu bảo mật và bất kì ai nếu muốn xem những gì Apple cam kết là có đúng hay không, không chỉ ở thời điểm này mà là cho mọi cập nhật trở về sau. Đó là một phần của Private Cloud Compute (PCC) mà Apple giới thiệu chung với Apple Intelligence.

Trong tài liệu của Apple nói về Apple Intelligence, Apple cho biết họ sử dụng 2 foundation model do họ tự xây dựng, 1 mô hình sẽ dành cho xử lý on-device (Apple on-device model) với 3 tỷ tham số và 1 mô hình lớn hơn chạy trên cloud (Apple Server model) và được bảo mật nhờ Private Cloud Compute.

Fig1-Responsible-AI-8bf7727ab5.png
Các mô hình AI của Apple được fine-tune và adaptive cho các tác vụ cũng như tính năng rất cụ thể trên thiết bị của người dùng như tóm tắt, sửa chính tả, trả lời email, tạo Genmoji,….Các gói dữ liệu mà Apple sử dụng để huấn luyện các mô hình này là các data công khai, được cấp phép để truy cập và thu thập, Apple sử dụng một con crawler là AppleBot để crawl dữ liệu về và huấn luyện trên 2 foudation model của họ.
Apple sử dụng TPU, GPU đám mây và GPU do họ tự xây dựng để train các mô hình AI, nói về TPU thì có lẽ Apple sử dụng Google Axion, mình đoán thôi chứ Apple thì họ không nói, đây là chip xử lý AI được xây dựng trên kiến trúc ARM.

Sau quá trình pre-training và post-training, Apple tiến hành tối ưu hoá (optimization) hai model của họ, Apple sử dụng một extensive set optimization (không biết dịch cụ thể là gì) để cải thiện hiệu suất suy luận frist token và extended token.

Kết quả theo Apple công bố là iPhone 15 Pro cho độ trễ ở token đầu tiên chỉ là 0.6ms và tốc độ có thể lên đến 30 tokens trên giây.

Ảnh màn hình 2024-06-12 lúc 15.35.34.png
Các bài benchmark của Apple công bố thì model AI on-device cũng cho điểm số tốt hơn Phi-3-mini của Microsoft dành cho tính năng tóm tắt (summarize), hay trong một số bài benchmark khác anh em có thể xem ở bảng bên dưới.



Một ví dụ rất cụ thể mà Crag Federighi đưa ra khi nói về lợi ích của Apple on-device model với các thiết bị iDevices đó là ví dụ bạn hướng dẫn Apple Intelligence gửi một email cho các thành viên trong gia đình về buổi tiệc sinh nhật vào buổi trưa và đi kèm với thông tin địa chỉ của nhà hàng. Bạn không cần phải làm gì, không cần phải nhắc lại gia đình bạn gồm những ai, địa chỉ nhà hàng ở đâu vì các thông tin đó đều nằm trên điện thoại và Apple Intelligence sẽ tự biết điều đó.

Tuy nhiên để xử lý thông tin mở tốt hơn, các thông tin yêu cầu phải có nguồn kiến thức rộng lớn hơn thì việc Apple hợp tác với OpenAI là điều cần thiết. Tuy nhiên, cần phải làm rõ thêm rằng các tính năng sử dụng ChatGPT tích hợp trên iOS, iPadOS và macOS không sử dụng Apple Intelligence hay kiến trúc PCC của Apple, hai thứ này là hoàn toàn tách biệt nhau.

Ông cũng nói thêm rằng, Apple nhận thấy ChatGPT hiện tại đang là tốt nhất cho các kiến thức tổng quát mà người dùng sẽ truy vấn, nhưng Apple cũng đề cao quyền riêng tư của người dùng khi cảnh báo trước bất kì dữ liệu nào mà người dùng gửi cho OpenAI cũng cần phải có sự đồng ý của chính người dùng đó. Và vì Apple chọn dùng ChatGPT hay model GPT-4o vì nó tốt thì trong tương lai, Apple cũng có thể lựa chọn một LLM nào khác, hoặc cho phép người dùng sử dụng nhiều LLM khác nhau trên cùng một nền tảng hệ điều hành.

Điều này mở ra một nhu cầu rất lớn cho người dùng, ví dụ một bác sĩ sử dụng iPhone, người ta sẽ cần một model AI nào đó có thể giúp đỡ chuyên môn về vấn đề y tế, hoặc một giáo viên sẽ cần một model AI nào đó phục vụ tốt cho công việc của họ trên iPad, hoặc một nhà phân tích chiến lược có thể cần một model AI cụ thể cho những phân tích của họ trên máy Mac chẳng hạn, đó sẽ là nơi mà những đối thủ tiềm năng của ChatGPT sẽ tìm đến.

Apple cho biết họ cũng đang làm việc tích cực để đem trải nghiệm Apple Intelligence đến thị trường Trung Quốc, thị trường trọng điểm thứ hai của Apple nhưng tại quốc gia này có các quy định rất chặt chẽ về vấn đề AI, đặc biệt khi Apple sử dụng các công cụ không phải do công ty Trung Quốc sản xuất.

apple-intelligence-ios-18-beta-macos-15-ipados-18.webp
Đó là câu nói của Crag Federighi khi biên tập viên của FastCompany nhận định về Apple sẽ trở thành công ty đi đầu về AI, công ty AI lớn nhất hành tinh khi iOS 18, iPadOS 18 và macOS Sequoia ra mắt và Apple Intelligence sẽ được đưa hàng trăm triệu thiết bị. Crag không cho rằng Apple là công ty lớn nhất về mọi thứ, Apple tập trung vào trải nghiệm người dùng, vào sản phẩm và Apple đánh giá bản thân dựa trên những trải nghiệm mà Apple mang lại cho người dùng cũng như cách Apple bảo vệ người dùng và lợi ích của họ.

Sau cùng, AI chỉ là phương tiện để Apple đạt được mục đích đó mà thôi.