Thứ Hai, 15 tháng 9, 2025

Network Link Prediction

Network Link Prediction (dự đoán liên kết trong mạng) là một nhánh của khoa học mạng (network science) và machine learning, với mục tiêu dự đoán xem liệu hai nút trong mạng có khả năng hình thành một liên kết mới trong tương lai hay không, hoặc khôi phục các liên kết bị thiếu.


(Nguồn: https://www.analyticsvidhya.com/blog/2020/01/link-prediction-how-to-predict-your-future-connections-on-facebook/)


Điều này rất có ý nghĩa vì trong nhiều hệ thống thực tế (mạng xã hội, sinh học, kinh tế), mạng luôn thay đổi theo thời gian. Dữ liệu thu thập thường không đầy đủ, có thể bị thiếu liên kết. Khi đó, link prediction sẽ giúp hiểu rõ cấu trúc mạng, phát hiện mối quan hệ tiềm ẩn và dự đoán sự phát triển của mạng trong tương lai.

Phương pháp chính

  • Dựa trên độ tương đồng (similarity-based methods)
    • Local similarity: tính dựa trên hàng xóm chung
    • Global similarity: dùng đường đi ngắn nhất, Katz index, random walk.
    • Các chỉ số khác: Jaccard, Adamic–Adar, Resource Allocation.
  • Dựa trên mô hình xác suất
    • Giả định một mô hình sinh mạng (graph generative model). Ví dụ như Stochastic Block Model (SBM), mô hình đồ thị ngẫu nhiên, mô hình xác suất Bayes.


  • Dựa trên machine learning / deep learning
    • Trích xuất đặc trưng (features) từ cặp nút và huấn luyện mô hình phân loại (SVM, logistic regression).

    • Graph embedding (node2vec, DeepWalk, Graph Neural Networks – GNNs) → học vector đặc trưng cho nút, dự đoán xác suất liên kết bằng khoảng cách vector.


(Nguồn: https://www.nature.com/articles/s41598-019-47271-9)


Một số ứng dụng

  • Mạng xã hội, ví dụ: gợi ý bạn bè, gợi ý kết nối trên Facebook, LinkedIn.
  • Thương mại điện tử, ví dụ: gợi ý sản phẩm (user–item link).

  • Sinh học, ví dụ: dự đoán tương tác protein–protein, gen–bệnh, thuốc–mục tiêu.

  • Hệ thống tri thức, ví dụ: hoàn thiện mạng tri thức (knowledge graphs) bằng cách thêm quan hệ còn thiếu.

  • An ninh mạng, ví dụ: phát hiện kết nối bất thường.
  • Và nhiều các ứng dụng tiềm năng khác

Tài liệu tham khảo

  • https://www.sciencedirect.com/science/article/pii/S221509862400168X
  • https://www.sciencedirect.com/topics/computer-science/link-prediction
  • https://arxiv.org/pdf/2305.10257
  • https://www.tandfonline.com/doi/full/10.1080/17460441.2023.2267020

Thứ Bảy, 13 tháng 9, 2025

Simulation-based inference

 Simulation-Based Inference (SBI) là gì?

Simulation-Based Inference (SBI) (còn gọi là likelihood-free inference) là tập hợp các phương pháp ước lượng tham số và kiểm định mô hình thống kê khi hàm likelihood phức tạp hoặc không thể tính trực tiếp. Khi đó ta có thể mô phỏng dữ liệu từ mô hình giả định với các giá trị tham số cho trước. Ý tưởng là thay vì viết công thức chính xác cho likelihood, ta so sánh dữ liệu quan sát với dữ liệu mô phỏng, rồi rút ra kết luận về tham số.


(Nguồn: https://www.semanticscholar.org/paper/All-in-one-simulation-based-inference-Gloeckler-Deistler )


Các kỹ thuật phổ biến trong SBI

  • Approximate Bayesian Computation (ABC)

So khớp dữ liệu quan sát và mô phỏng qua thống kê tóm tắt (summary statistics) và giữ lại những tham số tạo ra dữ liệu “gần giống” dữ liệu quan sát.


  • Synthetic Likelihood

Ước lượng phân phối của thống kê tóm tắt bằng giả định Gaussian, rồi dùng làm “likelihood xấp xỉ”.

  • Neural Simulation-Based Inference (hiện đại)

Dùng mô hình học sâu (neural density estimators như normalizing flows, variational autoencoders) để học trực tiếp phân phối hậu nghiệm từ dữ liệu mô phỏng.



(Nguồn: https://ars.els-cdn.com/content/image/1-s2.0-S0959440X25000065-ga1_lrg.jpg)

 

Các khả năng ứng dụng

  • Sinh học & di truyền học, ví dụ: mô hình tiến hóa, chọn lọc tự nhiên, dịch bệnh.

  • Khoa học xã hội & kinh tế, ví dụ mô hình agent-based để mô phỏng hành vi thị trường.

  • Vật lý thiên văn, ví dụ: mô phỏng vũ trụ, sự hình thành thiên hà.
  • Tài chính, ví dụ: mô phỏng rủi ro thị trường với mô hình phi tuyến khó tính likelihood.



Tài liệu tham khảo

  • https://simulation-based-inference.org/
  • https://arxiv.org/abs/2508.12939
  • https://transferlab.ai/series/simulation-based-inference/
  • https://openreview.net/forum?id=uClUUJk05H
  • https://astroautomata.com/blog/simulation-based-inference/

Thứ Năm, 11 tháng 9, 2025

Network-Based Inference (NBI)

Network-Based Inference (NBI) là một phương pháp trong khoa học mạng (network science) được phát triển để dự đoán hoặc gợi ý các mối quan hệ mới dựa trên cấu trúc của một mạng lưới đã biết.

Ý tưởng về NBI xuất hiện trong lĩnh vực hệ thống recommendation và khoa học mạng, đặc biệt trong các nghiên cứu của Zhou, Lü, Zhang và cộng sự (Physical Review E, 2007). Trước đó, hệ thống gợi ý chủ yếu dựa trên:

  • Collaborative filtering (lọc cộng tác),
  • Content-based filtering (dựa trên nội dung).

Các thuật toán này gặp khó khăn với vấn đề data sparsity (dữ liệu thưa) và cold-start problem (người dùng/mục tiêu mới). NBI được đề xuất như một giải pháp mới, dựa trên quan điểm lan truyền tài nguyên trong mạng thay vì chỉ tính toán độ tương đồng.

Nguyên lý hoạt động (Resource Allocation Process)

Quy trình NBI có thể mô tả thành 3 bước:

  • Khởi tạo tài nguyên (Initialization)

Gán mỗi nút mục tiêu mà người dùng đã kết nối một lượng tài nguyên bằng nhau.

Ví dụ: người dùng đã xem 3 bộ phim, mỗi phim có tài nguyên 1.

  • Phân bổ tài nguyên qua mạng (Diffusion)

Tài nguyên lan từ mục tiêu sang người dùng khác và tiếp tục lan đến mục tiêu khác. Bước này giống như “mượn thông tin” từ những người dùng tương tự, nhưng thông qua lan truyền chứ không tính trực tiếp cosine similarity.

  • Tính điểm gợi ý (Score Computation)

Sau khi lan truyền, mỗi mục tiêu chưa kết nối sẽ nhận được một lượng tài nguyên.

Giá trị tài nguyên cuối cùng bằng điểm gợi ý (recommendation score). 

Sắp xếp theo điểm để đề xuất.




(Nguồn: https://www.csbj.org/article/S2001-0370%2823%2900171-X/fulltext)

 

Tiềm năng ứng dụng

  • Hệ thống gợi ý (Recommendation system):

    • Sách (Amazon), phim (Netflix), nhạc (Spotify).

    • Giải quyết vấn đề dữ liệu thưa và nâng cao độ đa dạng đề xuất.

  • Y sinh học:

    • Gene–disease network: dự đoán gen tiềm năng liên quan đến bệnh.

    • Drug–target network: tìm ứng viên thuốc mới (drug repositioning).

  • Mạng xã hội:

    • Gợi ý kết bạn, gợi ý nhóm hoặc cộng đồng có liên quan.

  • Khoa học tri thức:

    • Phân tích mạng tác giả–bài báo, gợi ý hợp tác nghiên cứu.

Nguồn tham khảo

  • https://pmc.ncbi.nlm.nih.gov/articles/PMC3140052
  • https://www.sciencedirect.com/topics/computer-science/network-inference
  • https://www.wisdomlib.org/concept/network-based-inference-method
  • https://ieeexplore.ieee.org/document/7603879

Thứ Ba, 9 tháng 9, 2025

Marine economy vs Ocean economy vs Blue economy

Marine economy (Kinh tế biển)


Marine economy thường đề cập đến các hoạt động kinh tế trực tiếp liên quan đến biển và đại dương — bao gồm khai thác tài nguyên biển, vận tải biển, du lịch ven biển, nuôi trồng thủy sản, đóng tàu, dịch vụ cảng, và các ngành hỗ trợ khác.

Khái niệm marine economy hẹp hơn so với ocean economy ở chỗ thường tập trung vào phần kinh tế dựa vào vùng biển thuộc chủ quyền quốc gia (territorial waters, exclusive economic zones). Marine economy hướng đến phát triển kinh tế từ nguồn lợi biển, đôi khi ít nhấn mạnh yếu tố môi trường.

Ocean economy (Kinh tế đại dương)


Khái niệm ocean economy bao quát hơn marine economy, bao gồm mọi hoạt động kinh tế diễn ra trong hoặc liên quan đến đại dương, cả ở vùng biển quốc gia lẫn vùng biển quốc tế. Ocean economy Bao trùm tất cả các ngành kinh tế biển (marine industries) và các ngành công nghiệp, dịch vụ hỗ trợ trực tiếp/gián tiếp từ đại dương, như công nghệ biển sâu, năng lượng tái tạo ngoài khơi, nghiên cứu hải dương học.


(Nguồn: https://www.globalseafood.org/advocate/financing-a-sustainable-ocean-economy/)



Blue economy (Kinh tế xanh biển)


Blue economy dùng để chỉ một cách tiếp cận phát triển kinh tế biển dựa trên nguyên tắc bền vững, kết hợp tăng trưởng kinh tế, bảo tồn hệ sinh thái biển và bảo đảm sinh kế cho cộng đồng ven biển.  Blue economy có thể bao gồm mọi lĩnh vực của “ocean economy”, nhưng yêu cầu yếu tố bền vững, kể cả về môi trường và xã hội Mục tiêu của blue economy, ngoài tối đa hóa lợi ích kinh tế từ đại dương, còn hướng đến duy trì hoặc cải thiện sức khỏe của hệ sinh thái biển và lợi ích lâu dài cho thế hệ tương lai.


(Nguồn: https://development.asia/explainer/role-ocean-finance-transitioning-blue-economy-asia-and-pacific)



(Nguồn: https://msp4bio.eu/sustainable-blue-economy-an-integrated-path-forward/ )


Tham khảo

  • https://www.lse.ac.uk/granthaminstitute/explainers/what-is-the-blue-economy/
  • https://www.boldbusiness.com/society/blue-economy-imperative-bring-bold-opportunities/
  • https://development.asia/explainer/role-ocean-finance-transitioning-blue-economy-asia-and-pacific
  • https://www.oecd.org/en/topics/sub-issues/ocean/ocean-economy.html

Chủ Nhật, 7 tháng 9, 2025

Bathymetry Modelling

Bathymetry là gì?

Bathymetry là môn khoa học nghiên cứu về độ sâu và hình dạng của địa hình dưới mặt nước (đáy biển, đáy sông, đáy hồ). Có thể hiểu đây là “địa hình dưới nước”, tương tự như topography (địa hình trên đất liền). Kết quả nghiên cứu thường là bản đồ bathymetric (bản đồ địa hình đáy biển).




(Nguồn: https://sketchplanations.com/topography-and-bathymetry)

 Bathymetry Modelling là gì?


Mô hình hóa bathymetry là quá trình xây dựng mô hình toán học, thống kê hoặc máy tính để biểu diễn độ sâu và hình dạng địa hình dưới đáy biển/đáy sông.

Nguồn dữ liệu chính để mô hình hóa địa hình dưới nước bao gồm:
  • Đo trực tiếp
  • Sonar (âm thanh): Single-beam, Multi-beam Echo Sounder.
  • LIDAR bathymetry: dùng tia laser từ máy bay quét ở vùng nước nông.
  • ROV hoặc tàu ngầm: khảo sát cục bộ với độ chính xác cao.
  • Đo gián tiếp / viễn thám
  • Vệ tinh altimetry (đo cao độ mặt biển để suy ra địa hình đáy).
  • Dữ liệu trọng lực.


(Nguồn: https://www.infotechenterprises.net/bathymetry.php)



Sau khi có dữ liệu, nhà nghiên cứu thực hiện nội suy và mô hình hóa bằng các công cụ thống kê như kriging, spline...; hoặc dùng machine learning để dự đoán hình dạng đáy ở vùng chưa có dữ liệu đo. Cụ thể bao gồm:
  • Thống kê địa lý (Geostatistics): kriging, mô hình variogram.
  • Trí tuệ nhân tạo (AI): dự đoán bathymetry bằng dữ liệu sonar + vệ tinh.
  • Mô hình thủy động lực: kết hợp bathymetry với mô hình dòng chảy và sóng.
  • GIS & 3D visualization: tạo mô hình số độ cao (DEM) của đáy biển.

Ứng dụng của Bathymetry Modelling

Trong hàng hải

  • Xác định tuyến đường tàu an toàn.
  • Tránh vùng nước cạn, đá ngầm.
  • Kỹ thuật & quy hoạch ven biển
  • Xây cảng, đê chắn sóng, trang trại điện gió ngoài khơi.
  • Đặt đường ống, cáp ngầm.

Trong nghiên cứu môi trường và khí hậu

  • Xác định hệ sinh thái đáy (san hô, ngư trường).
  • Nghiên cứu xói lở bờ biển, biến đổi mực nước biển.
  • Phòng chống thiên tai
  • Mô phỏng sóng thần, bão, dòng chảy (bathymetry ảnh hưởng trực tiếp đến sự lan truyền sóng).
  • Nghiên cứu trượt lở, động đất dưới biển.

Trong khai thác và quản lý tài nguyên biển

  • Ngư trường cá.
  • Khai thác khoáng sản (nốt mangan, lớp vỏ cobalt).
  • Nghiên cứu khoa học

Cũng có thể ứng dụng trong nghiên cứu kiến tạo mảng, núi lửa ngầm, sự hình thành rãnh đại dương.


(Nguồn: https://oceanservice.noaa.gov/facts/bathyuses.html)


Tài liệu tham khảo

  • https://oceanservice.noaa.gov/facts/bathyuses.html
  • https://education.nationalgeographic.org/resource/bathymetry/
  • https://oceanservice.noaa.gov/facts/bathyuses.html

Thứ Bảy, 6 tháng 9, 2025

Thứ Bảy, 16 tháng 8, 2025

Chemometrics

 Chemometrics là gì?

Chemometrics (Thống kê hóa học) là lĩnh vực kết hợp giữa hóa học, toán học, thống kêkhoa học máy tính nhằm thiết kế thí nghiệm hiệu quả, phân tích dữ liệu hóa học phức tạp, và  xây dựng mô hình toán học để dự đoán và giải thích hiện tượng hóa học

Chemometrics được xem như là nghệ thuật biến dữ liệu hóa học thành thông tin hữu ích và tri thức.


(Nguồn: https://www.sciencedirect.com/topics/chemistry/chemometrics)


(Nguồn: https://ondalys.fr/en/scientific-resources/chemometrics-vs-machine-learning/)


Vì sao chemometrics quan trọng?

Trong thời đại công nghệ phân tích tiên tiến như quang phổ (spectroscopy), sắc ký (chromatography), khối phổ (mass spectrometry)… mỗi phép đo có thể tạo ra hàng nghìn đến hàng triệu điểm dữ liệu. Nếu không có công cụ phân tích phù hợp, chúng ta sẽ bị “ngợp” trong dữ liệu mà không rút ra được điều gì hữu ích.

Do vậy, chemometrics giúp tiết kiệm thời gian và chi phí bằng cách tối ưu số lượng thí nghiệm, nâng cao độ chính xác khi xác định thành phần, cấu trúc hoặc tính chất mẫu, phát hiện sai sót hoặc gian lận trong sản xuất và kiểm nghiệm, và hỗ trợ ra quyết định nhanh chóng trong kiểm soát chất lượng

Những nhiệm vụ chính của chemometrics

  1. Thiết kế thí nghiệm (Design of Experiments – DoE)
    Lập kế hoạch thu thập dữ liệu sao cho ít thí nghiệm nhất nhưng vẫn đủ thông tin để phân tích.

  2. Xử lý tín hiệu và dữ liệu
    Loại bỏ nhiễu, chuẩn hóa dữ liệu, hiệu chỉnh nền… để dữ liệu “sạch” và dễ phân tích hơn.

  3. Phân tích đa biến (Multivariate Analysis)
    Sử dụng các phương pháp như PCA (Principal Component Analysis), PLS (Partial Least Squares) để tìm mối quan hệ giữa dữ liệu đo đạc và đặc tính mẫu.

  4. Mô hình hóa và dự đoán
    Xây dựng mô hình định lượng – ví dụ dự đoán nồng độ chất trong mẫu chỉ dựa vào phổ đo.

Cùng với sự bùng nổ của trí tuệ nhân tạo (AI)học máy (machine learning), chemometrics đang mở rộng khả năng phân tích dữ liệu hóa học lên một tầm cao mới. Những mô hình kết hợp AI có thể dự đoán chính xác thành phần hoặc tính chất của mẫu chỉ trong vài giây – điều mà trước đây mất hàng giờ hoặc hàng ngày.

Tham khảo 

  • https://www.sciencedirect.com/topics/chemistry/chemometrics
  • https://food.ku.dk/english/research_at_food/research_fields/chemometrics/
  • https://www.intechopen.com/chapters/41761
  • https://github.com/cran/chemometrics
  • https://github.com/clicumu/py-chemometrics

Network Link Prediction

Network Link Prediction (dự đoán liên kết trong mạng) là một nhánh của khoa học mạng (network science) và machine learning, với mục tiêu d...