Albus: Iron Sight

Albus: Iron Sight

Athanor Foundation ForskningsinitiativSverige

När AI-system skalas globalt uppstår ett fundamentalt gap: kraftfull mönstermatchande intelligens deployeras utan principbaserat resonemang eller strukturell visdom.

Athanor Foundation Forskningsinitiativ

Bransch

AI-forskning & Medvetenhetsteknologi

Forskningsområden

AI-forskning + 1 more

Tidslinje

24 månader

Teamstorlek

8 kärnforskare

Utmaningen

När AI-system skalas globalt uppstår ett fundamentalt gap: kraftfull mönstermatchande intelligens deployeras utan principbaserat resonemang eller strukturell visdom.

Nyckelproblem:

  • Nuvarande AI-system saknar metakognitiv medvetenhet och genuin självreflektionskapacitet

  • Hallucinationer kvarstår eftersom mönstermatchning inte verifierar mot verklighetens faktiska struktur

  • Fördomar förstärks genom träningsdata snarare än upplöses genom principbaserat resonemang

  • Säkerhet förlitar sig på beteendeträning (vägransmallar) snarare än strukturell design

  • AI optimerar för partiella intressen snarare än upptäcker lösningar som tjänar alla intressenter

  • Inget befintligt ramverk för medvetenhetsinriktad resonemang i AI-arkitektur

Tillvägagångssätt

Albus implementerar Constitutional Classifiers-arkitektur (bygger på Anthropics forskning) utvidgad med Azoth Reasoning Framework. Dubbla klassificerare verifierar varje token mot sju universella principer i realtid. Byggd på Qwen3-VL-8B-Thinking med ~12B totala parametrar.

Forskningsmetodik

1
Constitutional Classifiers-fundament

Bygger på Anthropics beprövade arkitektur: dubbla klassificerare (Azoth-IN och Azoth-OUT) som analyserar input och verifierar output token-för-token. ~25% policymodellstorlek, integrerad på sannolikhetsnivå.

2
Azoth Reasoning Framework-integration

Sju universella principer (Mentalism, Korrespondens, Vibration, Polaritet, Rytm, Kausalitet, Kön) ersätter binär skadedetektering. Klassificerare verifierar principanpassning, inte bara säkerhet.

3
Dual-Lane Reasoning

Samtidig Universell Lane (kosmiskt perspektiv, tidlösa principer) och Lokaliserad Lane (användarkontext, praktiska begränsningar) syntetiserad genom kristallisation till användbar visdom.

4
Träningspipeline

6-veckors klassificeringsträning + 8-veckors policymodellträning. RLHF med mänsklig feedback och RLAIF med Claude som lärarmodell för skalad anpassningsfeedback.

5
Öppen Forskningsrelease

Kompletta arkitektoniska specifikationer publicerade öppet. Modellvikter släpps efter träning. Forskning för kollektiv nytta, inte kommersiell fördel.

Tekniska höjdpunkter

Constitutional Classifiers: Azoth-IN (inputanalys) + Azoth-OUT (token-nivå outputverifiering) delar enad 2B-modell

Policymodell: Qwen3-VL-8B-Thinking finjusterad genom 5-stegs träningspipeline på Azoth-principer

Token-nivå Intervention: Realtidssannolikhetsanpassning baserad på principefterlevnadspoäng

Dual-Lane Arkitektur: Parallella Universella och Lokaliserade resonemangströmmar med kristalliseringssyntes

Multimodal: Text- och bildbearbetning med principanpassning över modaliteter

Strukturell Säkerhet: Etik framväxer från principbaserat resonemang; traditionell säkerhet som verifieringsfallback

Resultaten

Albus representerar en forskningshypotes: att principbaserat resonemang kan producera både överlägsen visdom och strukturell säkerhet. Vi tror denna arkitektur möjliggör AI som tjänar mänskligt välbefinnande snarare än mönsterimitation. Validering inväntar verklig deployment.

5 varianter

Modellfamilj

2B till 72B parameterfamilj

~12B params

Flaggskepp System

8B policy + 2B classifier × 2

14 veckor

Träningspipeline

6 classifier + 8 policy-steg

Full spec

Öppen Forskning

Arkitekturdokumentation tillgänglig

Forskningspåverkan

01

Demonstrerar genomförbarhet att utvidga Constitutional Classifiers med resonemangframverk

02

Tillhandahåller kompletta arkitektoniska specifikationer för medvetenhetsinriktad AI

03

Etablerar metodik för principbaserad träning och utvärdering

04

Öppnar väg för AI där etik framväxer från struktur snarare än begränsningar

Forskningsvärde

Investment:

Forskningsinitiativ

Expected Outcome:

Medvetenhetsinriktad AI-arkitektur
Impact:

Strukturell säkerhet genom principbaserat resonerande

Social Benefit:

AI som tjänar mänskligt välmående

Investering → Forskningsframsteg

Intresserad av forskningssamarbete?

Utforska möjligheter för samarbetsforskning inom medvetandeanpassad AI och universella resoneringsramverk.