Na jarenlang te hebben gewerkt met informatiebeheer, archiefbeheer en PROV (Public Records Office of Victoria), is het een constante strijd geweest om mensen content te laten taggen. Jarenlang hebben we geworsteld om te werken met klassieke Records Management-teams die erop staan om buitensporige hoeveelheden Content Types en verplichte metadata te creëren om SharePoint "records compliant" te maken.
Het algemeen toepassen van deze klassieke methodologieën op SharePoint Online breekt het platform fundamenteel! Zaken als OneDrive-synchronisatie, cocreatie en samenwerking worden moeilijker of zelfs niet mogelijk, maar dat is niet het moeilijke. Het moeilijkste is om zonder enorme hoeveelheden werk gestandaardiseerde inhoudstypen en -waarden op alle sites toe te passen. Begrijp ons niet verkeerd, het kan worden gedaan en het pushen van inhoudstypen is slechts het begin van het probleem. Het probleem is om te voorkomen dat mensen bibliotheken, kolommen en andere lijsten maken die niet de standaard inhoudstypen hebben.
We zien nu een fundamentele verandering in de manier waarop informatiebeheer en archiefbeheer wordt aangepakt. Het gepraat over Cognitive Services of Machine Learning-algoritmen en AI wordt al een tijdje aangeprezen, maar de investering in technologie, kosten en tijd was tot nu toe onbetaalbaar.
SharePoint Syntex is het eerste product van het Project Cortex-initiatief van Microsoft en stelt eindgebruikers in staat om inhoudsmodellen te bouwen die documenten of formulieren indexeren en begrijpen. Zonder al te diep te gaan, kunnen organisaties SharePoint trainen om inhoudstypen toe te passen op items in SharePoint door middel van machine learning. Naast het toepassen van inhoudstypen, kan SharePoint Syntex informatie halen uit de daadwerkelijke documenten/items en kolommen vullen met waarden.

Een snel voorbeeld is ons Statement of Work (SoW) model. Met dit model hebben we SharePoint Syntex gericht op onze klantbibliotheken en alle SoW's gevonden die in de loop der jaren zijn gemaakt. We kunnen dan belangrijke informatie uit elke SoW halen, zoals de naam van de klant, onderwerpen, deliverables, dollarwaarde en leveringsdatum.
We hadden onlangs een klant die zijn hele archiefruimte (fysieke bestanden) Optical Character Recognition (OCR) liet scannen en uploaden naar SharePoint. Toen de gescande documenten werden geretourneerd, hadden ze geen andere fysieke metadata dan de naam, die overeenkwam met een doosnummer.
Aangezien er meer dan 20 miljoen documenten waren, schatten we dat als één persoon 100 documenten per dag zou kunnen openen, beoordelen en taggen, het ERG LANG zou duren om alles getagd te krijgen. Als alternatief kunnen we SharePoint Syntex gebruiken om dit voor ons te doen.
Met behulp van SharePoint Syntex konden we inhoud eerst scheiden en groeperen op basis van het inhoudstype op hoog niveau, zoals HR, Incident, Product, Financiën en vele andere. Door de inhoudstypen toe te passen, konden we Power Automate gebruiken om documenten naar Teams of groepen te verplaatsen op basis van de classificatie, en om basismetadata zoals "datum" te extraheren om te sorteren, en vervolgens bewaarbeleid toe te passen op deze documenten.
Nadat het document/de items op een hoog niveau waren gescheiden, konden we het model verder trainen om waarden uit het document te extraheren om in kolommen op te slaan, waardoor zoeken en andere activiteiten nog eenvoudiger werden.

Als voorbeeld hebben we enkele voorbeeldgegevens gebruikt om in ons Content Center te laden. We kunnen dan een classifier bouwen om Syntex te trainen om een e-mailveld uit de documenten te extraheren en vervolgens de gegevens te extraheren en in een SharePoint-lijst te plaatsen. Het potentieel van deze technologie is enorm en zal een revolutie teweegbrengen in de manier waarop organisaties gegevens op grote schaal opslaan, bewaren en classificeren.
Het beste deel van de hele oplossing was dat er helemaal geen code was, geen hosting of aparte omgevingen, alleen een kleine licentiekost. Deze modellen zijn voor eindgebruikers ook gemakkelijk aan te passen of aan te passen om nog meer waardevolle kennis te verkrijgen.