Das Projekt Schweizer Textkorpus ist Teil eines internationalen Forschungsvorhabens, welches das Ziel verfolgt, die deutsche Standardsprache des 20. Jahrhunderts ausgewogen zu erfassen und online zugänglich zu machen, indem deutschsprachige Texte aller Art digitalisiert werden (Zeitungsartikel, Werbung, Formulare, Anleitungen, Ratgeber, populäre Fachliteratur, Jugend- und Trivialliteratur, Belletristik etc.). Das Schweizer Teilprojekt Schweizer Textkorpus vereint deutschsprachige Texte von Schweizer Autorinnen und Autoren aus dem 20. Jahrhundert. Die digitale Sammlung ist analog zu den anderen Teilkorpora in Deutschland, Österreich und Italien anhand formaler, inhaltlicher und zeitlicher Kriterien aufgebaut. Sie stellt eine ausgewogene Repräsentation des Deutschschweizer Wortschatzes dar und kann als Grundlage für spezifisch schweizerische lexikografische Bedürfnisse dienen.
Das zusammen mit den Partnerprojekten aus Deutschland, Österreich und Italien entstehende gemeinsame digitale Textkorpus trägt den Namen Korpus C4 und soll am Ende rund 80 Millionen Textwörter umfassen. Seit April 2009 ist eine erste Version des Korpus C4 veröffentlicht (http://www.korpus-c4.org), die allerdings noch nicht den vollständigen Bestand an Textwörtern enthält. Für die deutsche Sprache des 20. Jahrhunderts steht damit erstmals ein ausgewogenes und regionale Varianten berücksichtigendes Textkorpus bereit, das sich für verschiedene linguistische Fragestellungen verwenden lässt.
Seit Anfang 2017 wird das Korpus um Schweizer Texte aus dem 21. Jahrhundert erweitert und umfasst seit Anfang 2019 zusätzliche 3,8 Mio. Textwörter für das 21. Jahrhundert.
Das Schweizer Textkorpus wurde von einer Forschungsgruppe des Deutschen Seminars der Universität Basel aufgebaut und in dieser Phase zur Hauptsache vom Schweizerischen Nationalfonds finanziert. Seit 2014 wird es am Schweizerischen Idiotikon betreut und von der Schweizerischen Akademie für Geistes- und Sozialwissenschaften finanziell unterstützt.