Shanghai Neardi Technology Co., Ltd. sales@neardi.com +86 17612192553
Dlaczego coraz więcej urządzeń brzegowych mówi o NPU i koprocesorach? RK3588 jest już potężnym SoC o mocy 6 TOPS (INT8), jednak w złożonych scenach, takich jak wnioskowanie wielozadaniowe, paralelizacja modeli i analiza wideo-AI, sufit obliczeniowy pojedynczego układu wciąż istnieje. RK1820 został stworzony dokładnie po to, aby przejąć tę część obciążenia i odciążyć główny SoC z „lęku obliczeniowego”. W sprzęcie edge-AI procesor hosta nie walczy już sam; gdy zadania AI przerastają możliwości harmonogramowania tradycyjnego CPU/NPU, koprocesor cicho wkracza i przejmuje część inteligentnego obciążenia.
![]()
RK1820 to koprocesor zbudowany specjalnie do wnioskowania AI i rozszerzania obliczeń; elastycznie współpracuje z hostami SoC, takimi jak RK3588 i RK3576, i komunikuje się z nimi wydajnie za pośrednictwem interfejsów PCIe lub USB.
| Kategoria możliwości | Kluczowe parametry i funkcje |
|---|---|
| Architektura procesora | 3× 64-bitowe rdzenie RISC-V; 32 KB pamięci podręcznej L1 I-cache + 32 KB pamięci podręcznej L1 D-cache na rdzeń, 128 KB współdzielonej pamięci podręcznej L2; RISC-V FPU precyzji H/F/D |
| Pamięć | 2,5 GB wbudowanej pamięci DRAM o dużej przepustowości + 512 KB SRAM; zewnętrzne wsparcie dla eMMC 4.51 (HS200), SD 3.0, SPI Flash |
| Kodek | Kodowanie JPEG: 16×16–65520×65520, YUV400/420/422/444; dekodowanie JPEG: 48×48–65520×65520, wiele formatów YUV/RGB |
| NPU | 20 TOPS INT8; mieszana precyzja INT4/INT8/INT16/FP8/FP16/BF16; frameworki: TensorFlow/MXNet/PyTorch/Caffe; Qwen2.5-3B (INT4) 67 tokenów/s, YOLOv8n (INT8) 125 FPS |
| Komunikacja | PCIe 2.1 (2 linie, 2,5/5 Gbps), USB 3.0 (5 Gbps, współdzielone z PCIe) |
| Główne funkcje | Wnioskowanie Edge-AI (wykrywanie / klasyfikacja / LLM), ogólne obliczenia RISC-V, akceleracja grafiki 2-D (skala / obrót), bezpieczeństwo AES/SM4 |
W systemie RK3588 + RK1820 potok zadań AI jest podzielony na czteropoziomową architekturę:
Aplikacja → Middleware → Wykonanie koprocesora → Kontrola i prezentacja.
Host RK3588: obsługuje harmonogramowanie zadań, wstępne przetwarzanie danych i wyniki wyjściowe, zarządzając całym przepływem pracy.
Koprocesor RK1820: dedykowany do obliczeń AI o dużej mocy, połączony z hostem za pośrednictwem PCIe, tworząc model współpracy „lekkiej kontroli + ciężkich obliczeń”.
| Etap | Aktor | Akcja |
|---|---|---|
| Żądanie aplikacji | RK3588 | Wywołanie zadania AI wydane z warstwy aplikacji (rozpoznawanie/wykrywanie) |
| Dystrybucja | Dystrybutor RK3588 | Decyduje, czy przenieść do koprocesora |
| Wnioskowanie | RK1820 | Uruchamia obliczenia modelu głębokiego uczenia |
| Zwrot | RK1820 → RK3588 | Odsyła wyniki wnioskowania; host wyświetla lub kontynuuje logikę |
Warstwa aplikacji to miejsce, w którym zaczyna się każde zadanie AI; tłumaczy wymagania użytkownika—analiza obrazu, wykrywanie obiektów, pytania i odpowiedzi LLM po stronie brzegowej itp.—na polecenia zadań wykonywalne przez system i przekazuje je do warstwy pośredniczącej za pośrednictwem standaryzowanych interfejsów API. Ta warstwa jest obsługiwana w całości przez hosta RK3588, który zarządza interakcją z użytkownikiem, logiką biznesową i danymi peryferyjnymi.
![]()
Odbiór zadań: pozyskuje polecenia użytkownika za pośrednictwem kamer, paneli dotykowych, Ethernetu, UART itp.
Standaryzacja poleceń: zamienia nieustrukturyzowane dane wejściowe na ustrukturyzowane parametry zadań
Warstwa pośrednicząca to centrum współpracy: ocenia każde zadanie, przydziela zasoby, wstępnie przetwarza dane i zarządza ruchem magistrali. Decyduje, czy zadanie jest uruchamiane na hoście, czy jest przenoszone do koprocesora.
Tylko RK3588; RK1820 nie bierze udziału w konfiguracji PCIe ani zarządzaniu przerwaniami—po prostu wykonuje zadania wnioskowania wysyłane przez hosta.
Klasyfikacja i harmonogramowanie zadań
Wstępne przetwarzanie danych
![]()
Kontrola komunikacji magistrali
Ta warstwa to rdzeń wnioskowania, napędzany wyłącznie przez koprocesor RK1820, dedykowany do obliczeń AI o dużej mocy.
RK1820 aktywny; RK3588 nie zakłóca wnioskowania, tylko czeka na wyniki. Przekroczenia limitu czasu lub wyjątki są obsługiwane przez RK3588 za pośrednictwem poleceń resetowania PCIe.
Odbiór i przygotowanie zadań
Odbiera dane, wagi modelu i polecenia wysłane przez RK3588; zapisuje je w lokalnej pamięci DRAM o dużej przepustowości, ładuje model i konfiguruje NPU.
Obliczenia wnioskowania NPU
Zwrot wyniku
Ta warstwa jest punktem końcowym każdego zadania AI: konwertuje surowe wyniki wnioskowania z RK1820 na wizualne lub gotowe do użycia wyniki biznesowe i zamyka pętlę.
RK3588 aktywny; RK1820 dostarcza tylko surowe dane wnioskowania.
![]()
Post-przetwarzanie wyników
Kontrola systemu i wyjście zwrotne
Wartość synergii: nie tylko szybciej, ale i mądrzej
| Etap | Aktor | Akcja |
|---|---|---|
| Żądanie aplikacji | RK3588 | Wywołanie zadania AI wydane z warstwy aplikacji (rozpoznawanie/wykrywanie) |
| Dystrybucja | Dystrybutor RK3588 | Decyduje, czy przenieść do koprocesora |
| Wnioskowanie | RK1820 | Uruchamia obliczenia modelu głębokiego uczenia |
| Zwrot | RK1820 → RK3588 | Odsyła wyniki wnioskowania; host wyświetla lub kontynuuje logikę |
Mówiąc prosto: RK3588 prowadzi show i utrzymuje wszystko na właściwym torze, podczas gdy RK1820 zapewnia surowe impulsy obliczeniowe; razem sprawiają, że urządzenia edge-AI są „mądrzejsze, szybsze i bezproblemowe”.
Śledź nas, aby uzyskać więcej wiadomości o RK1820 i aktualizacjach SDK, nowych samouczkach i gotowych do uruchomienia demonstracjach.