Việc "Huấn Luyện" Trí Tuệ Nhân Tạo Có Thể Thải Ra Tới 284 Tấn CO2

15 Tháng Bảy 20192:00 SA(Xem: 13566)
Việc "Huấn Luyện" Trí Tuệ Nhân Tạo Có Thể Thải Ra Tới 284 Tấn CO2
Việc Huấn Luyện Trí Tuệ Nhân Tạo Có Thể Thải Ra Tới 284 Tấn CO2

Người ta thường so sánh ngành công nghiệp trí tuệ nhân tạo với ngành dầu mỏ: một khi ta khai thác được dữ liệu, ta có thể tinh lọc để biến nó thành một thứ hàng trao đổi quý giá. Phép so sánh còn chỉ ra một điểm chung khác, khi xét tới những ảnh hưởng môi trường của quá trình xử lý deep learning.

Trong một báo cáo nghiên cứu mới, các nhà khoa học tại Đại học Massachusetts thực hiện đánh giá một vòng đời của một số khuôn mẫu trí tuệ nhân tạo quy mô lớn. Họ phát hiện ra rằng việc “huấn luyện AI” thải ra tới 284 tấn carbon dioxide ra môi trường, gấp 5 lần lượng khí thải trung bình của một chiếc xe hơi tại Mỹ thải ra từ khi nó được chế tạo cho tới khi thành phế liệu.

Những nhà nghiên cứu AI đã từ lâu nghi ngờ những ảnh hưởng tới môi trường mà những cỗ máy xử lý khổng lồ có thể có. Nhà khoa học máy tính Carlos Gómez-Rodríguez cảnh báo: “Nhiều người trong chúng ta có thể thấy sự ô nhiễm đôi chút trừu tượng và mù mờ, nhưng những con số không nói dối. Tôi hay những nhà nghiên cứu khác đã bàn luận về vấn đề trước đây, có thể khẳng định đây là vấn đề có thật”.

Trong nghiên cứu mới, thử nghiệm được chỉ đích danh là quá trình xử lý ngôn ngữ tự nhiên (natural-language processing - NLP), một lĩnh vực nhánh thuộc ngành AI, tập trung vào việc dạy máy móc ngôn ngữ con người. Trong hai năm, cộng đồng nghiên cứu NLP đạt được nhiều dấu mốc đáng chú ý, ví dụ như hoàn thiện câu nói, dịch thuật chính xác và những bài thử quy chuẩn khác. Hệ thống AI GPT-2 của OpenAI nổi tiếng với khả năng viết ra những bài báo giống như người viết. Nhưng những tiến bộ cũng đi kèm với hệ lụy. Cỗ máy học ngôn ngữ cần rất nhiều dữ liệu đầu vào, và quá trình xử lý hết chỗ thông tin đó cần rất nhiều năng lượng.

Trong ngành AI hiện nay, có bốn cỗ máy đáng chú ý, đã tạo ra được những cột mốc quan trọng. Chúng là the Transformer, ELMo, BERT và GPT-2.

Trong thử nghiệm, người ta cho chạy từng hệ thống trên một GPU duy nhất trong suốt một ngày để đo mức năng lượng tiêu thụ của chúng, sau đó lấy con số nhân với tổng thời gian chạy máy để ra được kết quả cuối cùng.

Lượng năng lượng tiêu thụ sẽ được quy đổi tương đương với lượng khí thải có thể thải ra. Con số cuối cùng là 284 tấn carbon dioxide.

Họ phát hiện ra rằng chi phí cho sức mạnh tính toán và phí bù carbon cho môi trường tăng tỷ lệ thuận với quy mô hệ thống, bùng nổ tại thời điểm tăng độ chính xác để ra được kết quả cuối cùng. Cụ thể, quá trình tăng độ chính xác có tên tìm kiếm cấu trúc mạng neural, tối ưu hóa độ chính xác bằng cách liên tục thực hiện phép thử loại, rất tốn năng lượng mà không được nhiều lợi ích.


Nếu bỏ qua bước kể trên, mô hình AI tốn kém nhất - BERT, sẽ thải ra 6,350 kg carbon dioxide. Con số 284 tấn CO2 là lượng khí thải tạo ra bởi hệ thống Transformer xử lý dữ liệu và chạy song song NLP.

Chưa dừng lại ở đó, các nhà nghiên cứu phát hiện ra con số đáng lo ngại vừa nêu chỉ có thể được sử dụng làm giới hạn dưới. Emma Strubell, người dẫn đầu nghiên cứu mới cho biết: “Khối lượng công việc khi huấn luyện một hệ thống máy học duy nhất mới chỉ ở mức tối thiểu”

Thực tế, những nhà nghiên cứu AI sẽ phát triển thêm những hệ thống mới, có thể đi lên từ con số không hoặc cải tiến những hệ thống có sẵn để nó có thể xử lý thêm những loại dữ liệu khác; cả hai quá trình sẽ đều tốn kém thêm nhiều thời gian huấn luyện AI cũng như tinh chỉnh.

Để tính ra lượng khí thải carbon thải ra trong cả quá trình nghiên cứu AI và xử lý dữ liệu, Strubell và đồng nghiệp sử dụng sẵn những thông tin đang có: Quá trình xây dựng và thử nghiệm 4,789 hệ thống machine learning trong quãng thời gian 6 tháng. Quy đổi sang đơn vị khí thải CO2, kết quả sẽ là 35,380 kg, hơn 35,000 tấn.

Tính nghiêm trọng của những con số đáng lo ngại cũng lớn như chính chúng, nhất là khi ngành công nghệ hiện đại đang muốn tập trung nhiều hơn vào AI. Những hệ thống machine learning có thể thực hiện được rất nhiều tác vụ hữu ích, những tập đoàn lớn hay những viện nghiên cứu có thể thu lợi lớn từ việc phân tích dữ liệu.

Không sớm thì muộn, ta cũng sẽ phải đặt ra câu hỏi “Liệu có đáng?”

Những kết quả nghiên cứu mới còn chỉ ra một vấn đề nan giải khác: ta cần đủ dữ liệu để cho những cỗ máy tiêu thụ, để mà ra được một kết quả nghiên cứu đáng kể. Gánh nặng đè lên vai những con người thuộc giới học viện, những người cung cấp đáng kể dữ liệu. Strubell cho biết thêm: “Học viện không thể bắt kịp xu hướng mới trong huấn luyện hệ thống trí tuệ nhân tạo, những học sinh mới tốt nghiệp là đối tượng đặc biệt bị ảnh hưởng, bởi lẽ chúng tôi không sở hữu sức mạnh tính toán lớn. Đây là vấn đề công bằng giữa các nhà nghiên cứu trong học viện và các nhà nghiên cứu trong ngành AI”.

Strubell và cộng sự mong muốn các đồng nghiệp khác hãy chú ý tới bài báo cáo, tìm cách cải tiến phần cứng hiện tại cũng như viết ra những thuật toán AI hiệu quả hơn. Não bộ con người có thể xử lý thông tin một cách kỳ diệu mà cần không quá nhiều năng lượng, câu hỏi lớn là: làm sao để xây dựng được một hệ thống máy học có khả năng tương tự?

52Vote
42Vote
31Vote
23Vote
12Vote
2.910
Gửi ý kiến của bạn
Tắt
Telex
VNI
Tên của bạn
Email của bạn
Tạo bài viết
22 Tháng Hai 2019
Khoảng giữa tháng 02/2019, theo các trang Bloomberg và Axios, các kĩ sư và lãnh đạo của Intel đang dự đoán rằng Apple sẽ chuyển sang sử dụng chip ARM thay cho CPU Intel vào năm 2020. Đây là một phần trong nỗ lực thống nhất nền tảng xuyên suốt mọi thiết bị mà Apple đang sản xuất, và cách đây không lâu, một số ý kiến cho rằng tới năm 2021 Apple sẽ thúc đẩy việc làm 1 ứng dụng chạy được trên cả iPhone, iPad và Mac. Việc chuyển đổi nền tảng dường như đã bắt đầu từ năm 2018 khi Apple mang nhiều ứng dụng từ iOS lên macOS, chẳng hạn như Voice Memos, Stocks, Home... Năm 2019, có thể Apple sẽ cho phép port app iPad sang macOS, nhiều thông tin hơn sẽ được thông báo tại hội nghị WWDC 2019 diễn ra vào tháng 6.
22 Tháng Hai 2019
Thiên hà xoắn ốc tráng lệ NGC 4565 được nhìn ở phía mép trên, từ Trái Đất. Còn được biết đến với cái tên Needle Galaxy (Thiên hà Cây Kim/ Kim Khâu) bởi mặt nhìn nghiêng nhỏ hẹp của nó, NGC 4565 tươi sáng là điểm dừng của rất nhiều ống kính thiên văn ở bầu trời phương bắc, nằm trong chòm sao mờ nhạt nhưng đẹp tinh tế: Coma Berenices (Hậu Phát).
22 Tháng Hai 2019
Khoảng giữa tháng 02/2019, sau sự kiện Unpacked, DJ Koh - co-CEO của Samsung rằng chiếc loa thông minh Galaxy Home của hãng sẽ được bán ra chính thức vào tháng 04/2019. Được ra mắt cùng lúc với sự kiện giới thiệu Galaxy Note 9 vào tháng 08/2018, tuy nhiên cho đến tháng 02/2019, người dùng vẫn chưa biết được thông tin giá bán và thời điểm bán ra chính thức của sản phẩm.
22 Tháng Hai 2019
Khoảng giữa tháng 02/2019, Quốc hội Nga đã thông qua quy định cấm các binh lính đang thực hiện nhiệm vụ sử dụng smartphone, vì những hệ quả của mạng xã hội đối với an ninh quốc gia.
22 Tháng Hai 2019
Khi nói tới smartphone cao cấp, Apple và Samsung thường cung cấp những tính năng tương đương nhau. Ví dụ, cả iPhone và Galaxy S mới nhất đều có màn hình tràn viền và công nghệ nhận dạng gương mặt. Tuy nhiên, theo một nhóm nhà phân tích tại Goldman Sachs, khi nói đến smartphone màn hình gập, Samsung sẽ vượt trội hơn tất cả các hãng kể cả Apple trong thời gian tới.
22 Tháng Hai 2019
Khoảng giữa tháng 02/2019, hệ thống tín dụng xã hội của Trung Quốc đang được thúc đẩy hoạt động trên diện rộng, hàng triệu cá nhân và doanh nghiệp ở Trung Quốc đã bị "gán mác" không đáng tin cậy, nằm trong "danh sách đen" của chính phủ, và họ sẽ không được phép tiếp cận thị trường tài chính hoặc di chuyển bằng máy bay, tàu hoả. "Danh sách đen thường niên" nằm trong nỗ lực thúc đẩy "sự đáng tin cậy" của xã hội Trung Quốc và cũng là sự mở rộng của hệ thống tín dụng xã hội, dự kiến sẽ chấm điểm cho 1.4 tỷ công dân.