Jia-Yau ShiauinAI Blog TW從 Sora 的技術背景解析當代 Video Generation 的方法與難題影片生成一直被認為是一項複雜的高維度任務,不僅要在圖像生成的基礎上處理時間連續性的問題,還面臨著高維數據處理的挑戰。長期以來,產生既高品質又有一定長度的影片對技術是一大考驗。在 2024 年 2 月 OpenAI 推出了 Sora 模型…Mar 11Mar 11
Jia-Yau ShiauinAI Blog TW用Python Typing提升程式碼的可維護性: 從基本標註到泛型標註Python Typing可以明確指定變數和函數的期望類型,這提升了程式碼的可讀性和清晰度,減少了在開發和維護過程中的不確定性。再搭配靜態分析工具的功能,能夠提供更精確的提示和錯誤檢查。然而,實踐的關鍵挑戰是如何在保持Python本身的動態特性和靈活性的同時,合理地…Dec 20, 2023Dec 20, 2023
Jia-Yau ShiauinAI Blog TWViT (Vision Transformer) 概述與優勢: 對比CNN與Swin等hierarchical方法今日在GPT (General Pretrained Transformer) 的助攻下,基於attention的Transformer早已是深度學習的主流模型之一。不過在電腦視覺領域,即使ViT (Vision Transformer) 與Swin…Aug 20, 20232Aug 20, 20232
Jia-Yau ShiauinAI Blog TW概述Model Reparameterization: RepVGG 與後續作 (RepOptimizer, QARepVGG, MobileOne)2021 年的 RepVGG 提出了一種在訓練時是 multi-branches ,但在推理 (inference)時可以重參數化 (reparameterize) 成 plain CNN model 的架構。讓模型在表現提升的同時,仍然保有 plain model…May 18, 2023May 18, 2023
Jia-Yau ShiauinAI Blog TWStable Diffusion背後的技術:高效、高解析又易控制的Latent Diffusion Model近年,生成式模型 (generative model) 用於圖像生成展現了驚人的成果,最知名的莫過於基於 diffusion model 的 Stable Diffusion 與 Midjourney。雖然目前還無法完整地指出 Midjourney 背後的方法,但透過…Apr 16, 2023Apr 16, 2023
Jia-Yau ShiauinAI Blog TW為軟體團隊帶入AI力量的思辨: 使用ChatGPT與Github Copilot科技的演進總是會帶來新的工具。隨著近年人工智慧 (artificial intelligence) 的發展,我們即將踏入新世代 AI 輔助工具的入口。在程式碼撰寫上,最熱門的莫過於 OpenAI 開發的 GitHub Copilot 與 ChatGPT。然而,這些 AI…Mar 19, 2023Mar 19, 2023
Jia-Yau ShiauinAI Blog TW從YOLOF的觀點深入探究Feature Pyramid Networks (FPN)的背後價值在物件偵測 (object detection) 領域,FPN (feature pyramid network) 與其衍生架構是提升偵測準確度的常用技巧。而YOLOF明確地指出 FPN更重要的在於 divide-and-conquer的 label assignment….Jan 12, 2023Jan 12, 2023
Jia-Yau ShiauinAI Blog TW使用者導向的Kubernetes (k8s) 入門介紹: 基本架構與使用概念Kubernetes (k8s) 是用於自動部署、擴充和管理「容器化應用程式」的開源系統,是目前軟體開發領域炙手可熱的要角。藉由 Kubernetes可以建構出一套穩健的 cluster與營運系統,並且無縫使用大量的開源專案資源。不過 Kubernetes本身…Oct 23, 2022Oct 23, 2022
Jia-Yau ShiauinAI Blog TW管理模組化Python程式: 從獨立Project到Package或 Submodule在 Python中,可以使用的方法就是利用 git原生的 submodule來達成程式碼的隔離與版號的控管,適合仍處於開發改動密集的子模組。另一個方法則是打包為 Python package直接提供安裝,公開專案…Jul 12, 2022Jul 12, 2022
Jia-Yau ShiauinAI Blog TW實作理解Diffusion Model: 來自DDPM的簡化概念Diffusion model是一個透過變分推斷 (Variational Inference) 訓練的參數化馬可夫鍊 (Markov Chain),並且在許多任務上展現了超越 GAN的效果,其中最知名的應用莫過於 OpenAI的 DALL-E 2與 Google…May 31, 20222May 31, 20222