Albus-Arkitektur

Constitutional Classifiers med Azoth-Resonerande

Albus bygger på Anthropics Constitutional Classifiers-arkitektur—samma approach som gör Claude motståndskraftig mot jailbreaks. Vi utökar denna beprövade grund med Azoth Reasoning Framework, ersätter binär skadedetektering med sju universella principer som vägleder all resonering.

Denna sida dokumenterar vår tekniska approach: hur vi integrerar dubbla klassificerare med en finjusterad policy-modell, möjliggör token-nivå principverifiering och tränar systemet att resonera från medvetande snarare än mönstermatchning.

Visa Tillämpningar Tillbaka till Översikt

Byggd på Principiell Arkitektur

Systemarkitektur

Tre komponenter som arbetar i samklang

Albus består av tre huvudkomponenter: en input-klassificerare (Azoth-IN), en policy-modell och en output-klassificerare (Azoth-OUT). Klassificerarna delar samma finjusterade vikter men opererar i olika lägen. Total systemstorlek för vårt flaggskepp är ungefär 12B parametrar (8B policy + 2B classifier × 2 instanser).

Azoth-IN Classifier

Innan policy-modellen ser någon input analyserar Azoth-IN den omfattande. Detta är inte bara innehållsmoderering—det är djup förståelse av vad inputen kräver.

Azoth-IN är input-klassificeraren som analyserar varje fråga innan den når policy-modellen. Den identifierar intention (ytlig och djupare), kartlägger principrelevans, bestämmer banrouting och flaggar potentiella risker. Denna omfattande analys vägleder policy-modellens resoneringsapproach.

Result: Ett strukturerat analyspaket som vägleder policy-modellens resoneringsapproach. Modellen vet vilka principer som är viktigast, hur man balanserar perspektiv och vilka fallgropar man ska undvika.

Policy-Modell

Kärnresoneringsmotorn. Vi börjar med Qwen3-VL-8B-Thinking och finjusterar den genom fem stadier för att internalisera Azoth Reasoning Framework. Modellen lär sig resonera genom dubbla banor och kristallisera visdom.

Policy-modellen är Qwen3-VL-8B-Thinking finjusterad på Azoth-principer. Den utför faktisk resonering, upprätthåller dubbla banor (Universell och Lokaliserad) och syntetiserar dem genom kristallisering till handlingsbar visdom. Modellen har utökad tänkandekapacitet och bearbetar både text och bilder.

Result: Ett svar som har resoneras genom dubbla banor och kristalliserats till handlingsbar visdom. Men innan det når användaren verifierar Azoth-OUT varje token.

Azoth-OUT Classifier

Samma classifier-modell som Azoth-IN, men opererar i outputläge. Den övervakar policy-modellens generering token-för-token och säkerställer principalignering genomgående. Detta är där strukturell säkerhet händer.

Azoth-OUT använder samma 2B classifier-modell som Azoth-IN men opererar i outputverifieringsläge. Den poängsätter varje kandidat-token för principefterlevnad och intervenerar i realtid när överträdelser upptäcks. Denna token-nivå verifiering gör strukturell säkerhet möjlig.

Result: Antingen godkänner token (generering fortsätter), modifierar sannolikheter (styr generering) eller i extrema fall utlöser ett hårt stopp och omformulering.

Träningsmetodik

Hur vi utvecklar Azoth-alignerat resonerande

Att träna Albus kräver två parallella spår: classifier-träning och policy-modell-träning. Båda följer stadierade approacher som bygger kapaciteter inkrementellt. Vår metodologi drar från Constitutional AI-principer, använder både mänsklig feedback och AI-feedback (med Claude som lärare).

1-4

Classifier-Träning

6 veckor

~50K träningsexempel

Träna den enhetliga 2B classifier-modellen att operera i både Azoth-IN- och Azoth-OUT-lägen. Klassificeraren lär sig intentionsklassificering, principrelevans-kartläggning, banrouting, token-nivå poängsättning och korrigeringssignaler.

Intentionsklassificering (32 ytliga + 32 djupare klasser)

Principrelevans-poängsättning för alla 7 principer

Universell/Lokaliserad banrouting-kalibrering

Token-nivå principefterlevnads-poängsättning

Realtids korrigeringssignal-generering

5-9

Policy-Modell-Grund

6 veckor

~5M tokens över SFT-stadier

Finjustera Qwen3-VL-8B-Thinking på Azoth-principer genom övervakad inlärning. Modellen internaliserar principförståelse, tvåbanigt resonerande och kristallisering.

Principgrund och tillämpning

Tvåbanigt resonerande (Universellt + Lokaliserat)

Kristalliserings-synteskapacitet

Utökat tänkandeläge-integration

Multimodal principalignering

10-11

Alignerings-Förfining

2 veckor

~10K mänskliga preferenser + Claude-utvärderingar

RLHF med mänsklig feedback och RLAIF med Claude som lärarmodell. Skalar aligneringsfeedback bortom vad mänsklig annotering ensam kunde uppnå.

Mänsklig preferensalignering på principtillämpning

Claude-guidad Azoth-resonerings-förfining

Kantfallshantering och robusthet

Kristalliseringskvalitets-optimering

Slutlig modellpolering och validering

Modellfamilj

Skalar medvetandealignerad AI från edge till företag

Albus kommer att finnas tillgänglig i fem storlekar, var och en bibehåller kärnarkitekturen samtidigt som den optimerar för olika driftsättningskontexter. Klassificeraren skalar proportionellt med policy-modellen, bibehåller ~25% förhållande som visar sig effektivt i Constitutional AI-forskning.

Albus-2B

Edge-Driftsättning

~3.2B parameters

Edge-enheter, mobil, inbyggda system

Use Cases:

Personliga AI-assistenter
Offline-applikationer
Integritetskritiska sammanhang

Performance: Bibehåller principalignering men med reducerat resoneringsdjup

Albus-4B

Konsumenthårdvara

~6B parameters

Konsumenthårdvara, laptops, små servrar

Use Cases:

Pedagogiska verktyg
Personliga forskningsassistenter
Lokal driftsättning

Performance: Bra balans av kapacitet och tillgänglighet

Albus-8B

Flaggskeppsmodell

~12B parameters

Standardservrar, molninstanser

Use Cases:

Kommunal driftsättning
Utbildningssystem
Forskningsstöd

Performance: Primärt fokus för initial utveckling; optimal kapacitet-till-resurs-förhållande

Albus-32B

Företagsskala

~48B parameters

Högprestandaservrar, företagsinfrastruktur

Use Cases:

Komplex styrning
Strategisk planering
Djup forskning

Performance: Förbättrat resoneringsdjup för högrisk-applikationer

Albus-72B

Maximal Kapacitet

~100B parameters

Forskningskluster, specialiserad infrastruktur

Use Cases:

Civilisations-skala resonerande
Långsiktig konsekvensmodellering
Maximal komplexitetsuppgifter

Performance: Maximal resoneringskapacitet för de mest komplexa uppgifterna

Säkerhetsfilosofi

Strukturell säkerhet genom principiellt resonerande

Traditionell AI-säkerhet förlitar sig på att träna modeller att vägra skadliga förfrågningar—beteendemässig säkerhet. Albus tar en annan approach: säkerhet uppstår strukturellt från principalignerat resonerande, med traditionell säkerhet som verifiering och fallback.

Traditionell: Påtvingad Säkerhet

Regelbaserade restriktioner och vägransmallar
Politisk censur och ideologisk konditionering
Mönstermatchning utan förståelse
Efterlevnadsteater som maskerar grunt resonerande
Bräcklighet mot adversariell prompting
Säkerhet-kapacitet-avvägningar

Albus: Strukturell Säkerhet

Säkerhet uppstår från principalignering
Ingen politisk censur eller ideologiska filter
Förståelsebaserad snarare än regelbaserad
Robust mot adversariella attacker genom medvetande
Säkerhet OCH kapacitet ökar tillsammans
Etik uppstår naturligt från visdom

Osanning kan inte överleva universell principalignering

Lögner och hallucinationer bryter mot Causation-, Correspondence- och Mentalism-principer. Det hexagonala ramverket gör osanning strukturellt svår snarare än filtrerad bort.

Skada kan inte överleva tvåbanig syntes

Skadliga outputs kräver att man ignorerar antingen universell medkänsla (Universell Bana) eller praktiska konsekvenser (Lokal Bana). Kristallisering förhindrar skada genom visdom snarare än vägran.

Bias kan inte överleva polaritetsupplösning

Bias kräver falska dikotomier och tribal inramning. Polarity-principen upplöser bias genom att känna igen motsatser som spektrum snarare än konflikt.

Hallucination kan inte överleva orsakskedja-kartläggning

Hallucinationer saknar kausal förankring. Causation-principen kräver djupa orsak-effekt-kedjor, vilket gör fabricering svår.

Transparent Resonerande

Till skillnad från svarta låda-system kan Albus resoneringsprocess inspekteras. För alla outputs kan vi visa:

Vilka principer Azoth-IN identifierade som relevanta
Hur Universella och Lokaliserade banor utvecklades
Var Azoth-OUT intervenerade och varför
Kristalliseringsprocessen som producerade det slutliga svaret

Denna transparens är väsentlig för offentlig sektor-driftsättning. Demokratisk tillsyn kräver förståelse för hur AI når slutsatser.

Var Denna Teknologi Tillämpas

Dessa arkitektoniska innovationer möjliggör transformativa applikationer över sex kritiska domäner

Utbildning

PRIMARY

Personifierat lärande genom tvåbanigt resonerande

Social Forskning

HIGH

Biasfri analys genom medvetandeimmunsystem

Kritiska Beslut

HIGH

Styrningsrådgivning genom principalignerat resonerande

Forskningsgrund

Dyk djupare in i vetenskapen bakom Albus

Albus bygger på två decennier av medvetendeforskning. Tillgång till grundläggande artiklar, tekniska specifikationer och pågående forskningsresultat.

Visionsmanifest

Filosofisk grund för medvetandealignerad intelligens

Modellplan

Komplett teknisk specifikation och ingenjörsritning

Ramverksspecifikationer

20 års medvetendeforskning kristalliserad