Welche Risiken bestehen, wenn man das gesamte Firmenwissen an eine KI anschliesst?

Zwei Hauptrisiken: Erstens deckt die KI schonungslos auf, wie es um die eigene Datenordnung steht – falsch gesetzte Berechtigungen werden plötzlich sichtbar. Analysen zeigen, dass in typischen Umgebungen rund 45 Prozent der Dokumente nicht klassifiziert sind und 83 Prozent der sensiblen Daten intern breiter geteilt werden als vorgesehen. Zweitens entsteht eine strategische Abhängigkeit: Der Lock-in entsteht weniger durch das KI-Modell selbst als durch das gesamte Ökosystem drumherum.

KI & Innovation 11. Juni 2026 5 Min. Lesezeit

Zugriff auf die eigene Datenbank und das Archiv: KI ans Firmenwissen anschliessen?

Q: Wie sollte ein kleineres Büro beim Anschluss des Firmenwissens an KI vorgehen?

Die Frage ist nicht «anschliessen oder nicht», sondern «in welcher Reihenfolge». Zuerst Ordnung in die eigenen Daten und Berechtigungen bringen, dann bewusst entscheiden, welches Wissen an welche Lösung angeschlossen wird – und sich dabei den Weg zu einer unabhängigen Alternative offenhalten.

Was grosse Unternehmen schon länger können, ist nun auch für kleinere Büros möglich: der KI-Zugriff auf den eigenen Server und die eigenen Dokumente. Doch ist es wirklich die richtige Strategie, das gesamte Wissen einfach anzuschliessen?

KI-Zugriff auf die eigene Datenbank und das Archiv – ausgewählte Dokumente werden an eine souveräne Schweizer KI angeschlossen, sensible Daten bleiben gesperrt — Bewusst statt pauschal: Ausgewähltes Firmenwissen wird an eine souveräne KI angeschlossen – sensible Daten bleiben gesperrt

Was jetzt möglich ist

Microsoft, Google, Perplexity und Anthropic (Claude) bieten heute alle Schnittstellen an, mit denen sich das gesamte Firmenwissen – Projektablagen, E-Mails, Berichte, Pläne – an einen KI-Assistenten anschliessen lässt. Was vor Kurzem noch Konzernen mit eigenen IT-Abteilungen vorbehalten war, ist damit auch für kleinere Büros erreichbar geworden: Der KI-Assistent beantwortet Fragen direkt aus dem eigenen Archiv, findet den Bericht von vor drei Jahren und fasst die Korrespondenz zu einem Projekt zusammen.

Für Planungsbüros, Verwaltungen und KMU ist das verlockend – das institutionelle Wissen, das in Ordnerstrukturen und Postfächern schlummert, wird plötzlich abfragbar.

Die Technik dahinter: Retrieval Augmented Generation

Technisch steckt hinter diesen Angeboten meist Retrieval Augmented Generation (RAG): Das Sprachmodell wird mit einer Suche über die eigenen Dokumente kombiniert. Stellt jemand eine Frage, sucht das System zuerst die relevanten Passagen aus dem Archiv heraus und gibt sie dem Modell als Kontext mit. Die Antwort basiert damit auf den eigenen Unterlagen – ohne teures Training eines eigenen Modells.

Das Fraunhofer IESE erklärt das Verfahren verständlich, und das Mittelstand-Digital Zentrum Chemnitz zeigt, was damit für KMU konkret möglich wird – vom Kundenservice bis zur Angebotserstellung.

Doch ist es wirklich die richtige Strategie, das gesamte Wissen einfach anzuschliessen? Zwei Punkte stimmen mich nachdenklich.

Erster Vorbehalt: Wer alles anschliesst, deckt die eigene Datenordnung auf

Wer alles anschliesst, deckt schonungslos auf, wie es um die eigene Datenordnung steht. Beim Microsoft Copilot zeigt sich das exemplarisch: Die KI durchsucht alles, worauf eine Person Zugriff hat. Falsch gesetzte Berechtigungen, die jahrelang niemandem auffielen, werden plötzlich sichtbar.

Die Zahlen dazu sind ernüchternd: Eine Analyse beziffert, dass in typischen Umgebungen rund 45 Prozent der Dokumente gar nicht klassifiziert sind, und eine Untersuchung von Concentric AI kam zum Schluss, dass 83 Prozent der sensiblen Daten intern breiter geteilt werden als vorgesehen. Eine datenschutzrechtliche Einordnung liefert Dr. Datenschutz.

Die KI erfindet das Berechtigungsproblem nicht – sie macht es nur sichtbar. Was vorher in der Tiefe der Ordnerstruktur verborgen war, ist plötzlich eine Suchanfrage entfernt.

Zweiter Vorbehalt: die Abhängigkeit

Wer sein Wissen tief in eine Plattform integriert, bindet sich strategisch – der Lock-in entsteht weniger durch das KI-Modell selbst als durch das gesamte Ökosystem drumherum. Indexierte Dokumente, eingespielte Workflows, geschulte Mitarbeitende: Je tiefer die Integration, desto teurer der Ausstieg.

Oder pointiert formuliert: Wer seine Daten nicht flexibel bewegen kann, besitzt sie nur theoretisch. Kein Wunder, suchen immer mehr Unternehmen aktiv nach europäischen Alternativen.

Dass es auch anders geht, zeigt ausgerechnet die Schweiz

Mit Apertus haben ETH Zürich, EPFL und das CSCS ein vollständig offenes Sprachmodell veröffentlicht – Architektur, Gewichte und Trainingsdaten sind frei zugänglich, und das Modell beherrscht sogar Schweizerdeutsch.

Über Schweizer Anbieter ist es inzwischen als durchgängig souveräne Lösung verfügbar: vom Modell über das Hosting bis zur Schnittstelle bleibt alles in der Schweiz. Wer sein Firmenwissen an eine KI anschliessen will, muss sich also nicht zwingend an ein US-Ökosystem binden.

Mein Fazit: nicht «ob», sondern «in welcher Reihenfolge»

Die Frage ist nicht «anschliessen oder nicht», sondern «in welcher Reihenfolge»:

Zuerst Ordnung schaffen: Datenablage und Berechtigungen bereinigen, bevor eine KI sie durchsuchbar macht. Was die KI findet, sollte gefunden werden dürfen.
Dann bewusst entscheiden: Nicht das gesamte Archiv pauschal anschliessen, sondern gezielt festlegen, welches Wissen an welche Lösung angebunden wird.
Den Ausstieg offenhalten: Lösungen bevorzugen, bei denen Daten und Index portabel bleiben – und den Weg zu einer unabhängigen Alternative wie Apertus nicht verbauen.

Genau hier setzen wir mit unseren Tools an: Schweizer Lösungen, bei denen das Wissen dort bleibt, wo es hingehört – bei Ihnen.

SPEKTRUM Archiv-Agent – KI-gestützte Suche, Analyse und Dokumentenerstellung aus dem Projektarchiv mit über 5700 Dokumenten — SPEKTRUMs unabhängig entwickelte Archiv-Agenten und Aufgaben-RAG

Erst Ordnung, dann Anschluss – und immer mit offenem Rückweg. Wer diese Reihenfolge einhält, nutzt die neuen Möglichkeiten, ohne die Kontrolle über das eigene Wissen abzugeben.

Häufige Fragen

Was ist Retrieval Augmented Generation (RAG)? +

RAG kombiniert ein Sprachmodell mit einer Suche über die eigenen Dokumente. Bei einer Frage sucht das System zuerst die relevanten Passagen aus dem Firmenarchiv heraus und gibt sie dem Modell als Kontext mit. Die Antwort basiert damit auf den eigenen Unterlagen – ohne teures Training eines eigenen Modells. Das macht den Ansatz auch für kleinere Büros bezahlbar.

Welche Anbieter ermöglichen den KI-Zugriff aufs Firmenwissen? +

Microsoft (Copilot), Google (Gemini for Workspace), Perplexity (Enterprise) und Anthropic (Claude) bieten heute alle Schnittstellen an, mit denen sich Projektablagen, E-Mails, Berichte und Pläne an einen KI-Assistenten anschliessen lassen. Daneben existieren europäische und Schweizer Alternativen, die auf offene Modelle wie Apertus setzen.

Welche Risiken bestehen beim Anschluss des gesamten Firmenwissens? +

Zwei Hauptrisiken: Erstens deckt die KI schonungslos auf, wie es um die eigene Datenordnung steht – falsch gesetzte Berechtigungen werden plötzlich sichtbar. Rund 45 Prozent der Dokumente sind in typischen Umgebungen nicht klassifiziert, 83 Prozent der sensiblen Daten werden intern breiter geteilt als vorgesehen. Zweitens wächst die strategische Abhängigkeit: Der Lock-in entsteht weniger durch das KI-Modell selbst als durch das Ökosystem drumherum.

Was ist Apertus? +

Apertus ist ein vollständig offenes Sprachmodell von ETH Zürich, EPFL und CSCS: Architektur, Gewichte und Trainingsdaten sind frei zugänglich, und das Modell beherrscht sogar Schweizerdeutsch. Über Schweizer Anbieter ist es als durchgängig souveräne End-to-End-Lösung verfügbar – die Daten bleiben in der Schweiz.

Wie sollte ein kleineres Büro konkret vorgehen? +

In dieser Reihenfolge: Zuerst Ordnung in Daten und Berechtigungen bringen. Dann bewusst entscheiden, welches Wissen an welche Lösung angeschlossen wird – nicht pauschal alles. Und dabei den Weg zu einer unabhängigen Alternative offenhalten, damit aus dem Anschluss keine Abhängigkeit wird.

RAG Firmenwissen Datensouveränität Vendor Lock-in Apertus KMU

Andreas Rupf

Raumplaner & KI-Berater · SPEKTRUM · ETH Zürich · LinkedIn

SPEKTRUM Angebot

KI-Beratung für Büros und Verwaltungen

Wir begleiten Sie von der Datenordnung über die Anbieterwahl bis zur souveränen Schweizer Lösung – pragmatisch, unabhängig und ohne Lock-in.

Mehr erfahren →

Connecting AI to Your Own Database and Archive: The Right Move for Smaller Offices?

What large companies have been able to do for some time is now within reach of smaller offices: AI access to your own server and documents. But is connecting all your knowledge really the right strategy?

AI access to your own database and archive – selected documents are connected to a sovereign Swiss AI while sensitive data stays locked — Deliberate, not wholesale: selected company knowledge is connected to a sovereign AI – sensitive data stays locked

What Is Now Possible

Microsoft, Google, Perplexity and Anthropic (Claude) all offer interfaces today that allow a company's entire knowledge base – project repositories, e-mails, reports, plans – to be connected to an AI assistant. What was recently reserved for corporations with their own IT departments is now within reach of smaller offices: the AI assistant answers questions directly from your own archive, finds the report from three years ago, and summarises the correspondence on a project.

For planning offices, public administrations and SMEs, this is tempting – the institutional knowledge dormant in folder structures and inboxes suddenly becomes queryable.

The Technology Behind It: Retrieval Augmented Generation

Technically, most of these offerings rely on Retrieval Augmented Generation (RAG): the language model is combined with a search across your own documents. When someone asks a question, the system first retrieves the relevant passages from the archive and provides them to the model as context. The answer is thus grounded in your own documents – without the expensive training of a custom model.

The Fraunhofer IESE explains the method in accessible terms, and the Mittelstand-Digital Zentrum Chemnitz shows what becomes concretely possible for SMEs – from customer service to proposal drafting.

But is connecting all your knowledge really the right strategy? Two points give me pause.

First Caveat: Connecting Everything Exposes Your Data Hygiene

Whoever connects everything mercilessly exposes the state of their own data organisation. Microsoft Copilot illustrates this perfectly: the AI searches everything a person has access to. Incorrectly set permissions that went unnoticed for years suddenly become visible.

The numbers are sobering: one analysis estimates that in typical environments around 45 percent of documents are not classified at all, and a study by Concentric AI concluded that 83 percent of sensitive data is shared more broadly internally than intended. A data protection assessment is provided by Dr. Datenschutz.

The AI does not invent the permissions problem – it merely makes it visible. What was previously hidden deep in the folder structure is suddenly one search query away.

Second Caveat: Dependency

Whoever integrates their knowledge deeply into a platform commits strategically – the lock-in arises less from the AI model itself than from the entire ecosystem around it. Indexed documents, established workflows, trained staff: the deeper the integration, the more expensive the exit.

Or, to put it pointedly: if you cannot move your data flexibly, you only own it in theory. No wonder more and more companies are actively looking for European alternatives.

Switzerland, of All Places, Shows It Can Be Done Differently

With Apertus, ETH Zurich, EPFL and CSCS have released a fully open language model – architecture, weights and training data are freely accessible, and the model even speaks Swiss German.

Through Swiss providers, it is now available as an end-to-end sovereign solution: from the model to the hosting to the interface, everything stays in Switzerland. Anyone wanting to connect their company knowledge to an AI does not necessarily have to tie themselves to a US ecosystem.

My Conclusion: Not "Whether", but "In What Order"

The question is not «connect or not», but «in what order»:

First, create order: Clean up data storage and permissions before an AI makes them searchable. What the AI finds should be allowed to be found.
Then decide deliberately: Do not connect the entire archive wholesale – define specifically which knowledge is connected to which solution.
Keep the exit open: Prefer solutions where data and index remain portable – and do not block the path to an independent alternative like Apertus.

This is exactly where our tools come in: Swiss solutions where the knowledge stays where it belongs – with you.

SPEKTRUM Archive Agent – AI-supported search, analysis and document generation from the project archive with over 5,700 documents — SPEKTRUM's independently developed archive agents and task RAG

First order, then connection – and always with an open way back. Following this sequence lets you use the new possibilities without giving up control over your own knowledge.

Frequently Asked Questions

What is Retrieval Augmented Generation (RAG)? +

RAG combines a language model with a search across your own documents. When a question is asked, the system first retrieves the relevant passages from the company archive and provides them to the model as context. The answer is thus grounded in your own documents – without the expensive training of a custom model. This makes the approach affordable for smaller offices too.

Which providers offer AI access to company knowledge? +

Microsoft (Copilot), Google (Gemini for Workspace), Perplexity (Enterprise) and Anthropic (Claude) all offer interfaces today for connecting project repositories, e-mails, reports and plans to an AI assistant. In addition, European and Swiss alternatives exist that build on open models like Apertus.

What are the risks of connecting all company knowledge? +

Two main risks: First, the AI mercilessly exposes the state of your data organisation – incorrectly set permissions suddenly become visible. Around 45 percent of documents in typical environments are unclassified, and 83 percent of sensitive data is shared more broadly internally than intended. Second, strategic dependency grows: the lock-in arises less from the AI model itself than from the surrounding ecosystem.

What is Apertus? +

Apertus is a fully open language model by ETH Zurich, EPFL and CSCS: architecture, weights and training data are freely accessible, and the model even speaks Swiss German. Through Swiss providers it is available as an end-to-end sovereign solution – the data stays in Switzerland.

How should a smaller office proceed concretely? +

In this order: First bring order to data and permissions. Then deliberately decide which knowledge is connected to which solution – not everything wholesale. And keep the path to an independent alternative open, so the connection does not turn into a dependency.

RAG Company Knowledge Data Sovereignty Vendor Lock-in Apertus SME

Andreas Rupf

Spatial Planner & AI Consultant · SPEKTRUM · ETH Zürich · LinkedIn

SPEKTRUM Services

AI Consulting for Offices and Administrations

We guide you from data organisation through provider selection to sovereign Swiss solutions – pragmatic, independent and without lock-in.

Learn more →

Zugriff auf die eigene Datenbank und das Archiv: KI ans Firmenwissen anschliessen?

Was jetzt möglich ist

Die Technik dahinter: Retrieval Augmented Generation

Erster Vorbehalt: Wer alles anschliesst, deckt die eigene Datenordnung auf

Zweiter Vorbehalt: die Abhängigkeit

Dass es auch anders geht, zeigt ausgerechnet die Schweiz

Mein Fazit: nicht «ob», sondern «in welcher Reihenfolge»

Häufige Fragen

Verwandte Artikel

Apertus: Souveräne KI für die Verwaltung

KI-Agenten für Ihr Büro

Das richtige LLM ist entscheidend

Firmenwissen KI-bereit machen?

Connecting AI to Your Own Database and Archive: The Right Move for Smaller Offices?

What Is Now Possible

The Technology Behind It: Retrieval Augmented Generation

First Caveat: Connecting Everything Exposes Your Data Hygiene

Second Caveat: Dependency

Switzerland, of All Places, Shows It Can Be Done Differently

My Conclusion: Not "Whether", but "In What Order"

Frequently Asked Questions

Related Articles

Apertus: Sovereign AI for Public Administration

AI Agents for Your Office

Choosing the Right LLM Is Crucial

Make Your Company Knowledge AI-Ready?