NMReDATA

"Cách mạng 4.0" đang rộ lên như là một cụm từ "thời thượng". Trong công nghệ vũ trụ, viễn thông, giao thông, quản lý thuế, ... với chính phủ, doanh nghiệp, gia đình ... cho xuống đến tận mớ rau, con cá, đâu đâu cũng thấy nói "Bốn chấm không, bốn chấm không !"

Về mặt kỹ thuật, công nghệ, NMR là một trong những lĩnh vực "cao ngất ngưởng", thường đi tiên phong trong việc ứng dụng các công nghệ mới nên việc tiếp cận và cập nhật "Cách mạng 4.0" là "khỏi phải nói" và  chắc là đã được khởi động từ lâu rồi. Thế mà mới đây, ngay trong tháng này, 25 chuyên gia đại diện cho 23 cơ sở nghiên cứu hàng đầu thế giới về NMR trong đó có cả hãng sản xuất máy NMR uy tín nhất là Bruker và 2 nhà cung cấp phần mềm NMR danh tiếng là ACDLab và MestreLab đã cùng nhau soạn thảo một kiến nghị: "Phải 4.0 dữ liệu NMR". Kiến nghị này được đăng trên tạp chí Cộng hưởng từ trong hóa học (Magnetic Resonance in Chemistry), số ra năm 2018 với tên: "NMReDATA, a standard to report the NMR assignment and parameters of organic compounds". Ở đây, NMReDATA là NMR extracted Data, hiểu là dữ liệu cấu trúc khai thác từ phổ NMR.

Tóm tắt ý tưởng của bài báo này như sau: Dữ liệu NMR, bao gồm dữ liệu phổ NMR các loại (1D, 2D, 3D, ...) và dữ liệu cấu trúc khai thác được từ phổ NMR (kết quả giải phổ) khá cồng kênh và phức tạp. Mặc dù cộng đồng NMR và các nhà xuất bản đã cố gắng hết sức để chuẩn hóa cách công bố dữ liệu NMR và cấu trúc trong các công bố quốc tế, nhưng vẫn còn lủng củng, cứ như đang ở thời 2.0 hay 3.0.

Những tiến bộ kỹ thuật công nghệ thời đại 4.0 cho phép và gây sức ép cộng đồng NMR phải sớm đưa ra một phương thức thống nhất để quản lý, công bố dữ liệu phổ NMR và cấu trúc phân tử một cách hợp lý, tối ưu hơn, dễ chia sẻ, dễ so sánh hơn. Dữ liệu theo chuẩn mới phải dễ hiểu, dễ khai thác đối với con người và dễ đọc, dễ nhúng cho máy tính và các phần mềm liên quan. Ý tưởng cụ thể và chi tiết về NMReDATA có trong bài báo dài 24 trang, chứa nhiều khái niệm sâu về quản lý, xử lý dữ liệu số, nhưng có thể tóm tắt ý tưởng này trong hình vẽ minh họa dưới đây. 

Ví dụ sơ đồ thiết kế bản ghi dữ liệu NMR của Menthol (trích từ bài báo)

Thực chất, các tác giả NMReDATA không đề xuất định dạng mới cho dữ liệu NMR mà vẫn sử dụng định dạng SDF (Structure Data Format), hoàn toàn tương thích với định dạng MOL quen thuộc. Cái mới chủ yếu là chuẩn hóa gói Dữ liệu phổ NMR + Dữ liệu cấu trúc rút ra từ phổ NMR.

Căn cứ vào bộ tên và uy tín của các tác giả và nơi họ làm việc thì việc thực hiện ý tưởng trên là hoàn toàn khả thi, nhưng chắc cũng không thể dễ dàng và nhanh chóng được.


Comments