Az onkológiai NLP-kutatás fejlesztése

Onkológiai adatok pontossága: Engedélyezés, azonosítás megszüntetése és megjegyzések az NLP-modell-innovációhoz

Onkológia nlp

A rákkezelés forradalmasítása a legmodernebb NLP-technológiákkal

A kliensnek, az egészségügyi ágazat jelentős szereplőjének, fejlett NLP-megoldásra volt szüksége ahhoz, hogy jelentős mennyiségű onkológiai kórlapot feldolgozzon. Az onkológiai kutatások finomítását célzó kulcsfontosságú kezdeményezés részeként a részletes adatelemzés és a szigorú adatvédelmi normák közötti egyensúly megteremtésének szükségessége a legfontosabb. Ez az esettanulmány felvázolja hozzájárulásunkat az ügyfél kutatási törekvéseinek fokozásához a nagy pontosságú adatfeljegyzések, szigorú deazonosítási gyakorlatok és a Natural Language Processing (NLP) technikák alkalmazásával, mindezt a HIPAA által biztosított szabályozási kereteken belül.

kötet

Adatlicencelés + Data De-ID
10 Oldalak
Onkológiai kapcsolatok
10 Oldalak
Nem onkológiai tartomány
10 Oldalak
Tagadás
10 Oldalak
Onkológiai tartomány
10 Oldalak
NER + kapcsolati feltérképezés
10 Oldalak

Kihívások

A projekt megkövetelte a klinikai dokumentáció árnyalt megértését, az egészségügyi entitások pontos azonosítását, valamint a tagadó címkék pontos alkalmazásának képességét, mindezt olyan biztonságos kereten belül, amely a HIPAA előírásai szerint védi a betegek adatait. A törekvés nemcsak technikai szakértelmet igényelt nagy mennyiségű összetett adat kezelésében, hanem stratégiai megközelítést is a visszajelzések beépítéséhez és a minőség megőrzéséhez az annotációs folyamat minden szakaszában.

Célkitűzések

A szolgáltatások részletes leírása

KategóriaLeírás
Átfogó klinikai adatok lefedettségeKülönféle jegyzettípusokat, gondozási beállításokat és onkológiai alspecialitásokat ölel fel, biztosítva a különböző klinikai forgatókönyveket tükröző, robusztus adatkészletet.
Szigorú de-azonosításBiztosítani kell az összes címkézett rekord azonosítását a HIPAA Safe Harbor módszerével összhangban, ezzel biztosítva az ügyfelek bizalmát az adatok védelme és biztonsága iránt.
Annotációs irányelvekSzabványos adatfeljegyzési irányelvek létrehozása és megvalósítása a címkézett rekordok elkészítéséhez a HIPAA szabványokkal összhangban.
Speciális annotációs stratégiák10,000 XNUMX oldalas onkológiával kapcsolatos feljegyzések kézi megjegyzéseit végezték el, részletesen a negációs állapotok és más vonatkozó információk azonosítására összpontosítva, a megállapított irányelveknek megfelelően.
Szigorú minőségbiztosításTeljesítse az irányelvben meghatározott minőségi szabványt

Megoldás

Megközelítésünk a következő kulcsfontosságú stratégiákat foglalta magában:

Testreszabott onkológiai adatkészlet összeállítása

A több mint 5 milliós EHR-ből álló hatalmas archívumból az adatok gondosan kiválasztott részhalmazát kinyertük, amelynek célja az ügyfelek speciális onkológiai adatok iránti igényeinek kielégítése volt, különös tekintettel a genomikai entitásokra. A gyűjtési folyamat magában foglalta a tumormarkerek, gének, variánsok és TNM-stádiumok kimerítő listájának létrehozását, kulcsszavas keresést alkalmazva az adatokban bővelkedő dokumentumok pontos meghatározásához. A reguláris kifejezéseket számos genetikai variáció és rákstádium azonosítására használták. Ez a megközelítés a különféle dokumentumtípusokat, szakterületeket, gondozási beállításokat és több orvostól származó adatokat átfogó adatlefedettséggel kombinálva átfogó és releváns onkológiai adatkészletet biztosított.

Onkológiai adatkészlet összeállítása

Szigorú de-azonosítás

A folyamat szigorúan betartotta a HIPAA Safe Harbor módszerét az azonosítás megszüntetésére, amely garantálja az ügyfél bizalmát az adatok védelmében és biztonságában. Ez magában foglalja az összes védett egészségügyi információ (PHI) eltávolítását, és címkézett helyőrzőkkel való helyettesítését, ezáltal megőrizve az adatok hasznosságát, miközben megóvja a betegek bizalmas kezelését.

Az azonosítás megszüntetésére szolgáló változók

Kategóriaalkategória
NévBeteg neve, orvos neve, ápoló neve, családtag neve, orvosi központ neve, klinika neve, ápolási otthon neve, cég neve, egyetem neve
Kor 
találkaDátum minta, hónap év minta, nap hónap minta, nap év minta, nap, hónap, év, évszak
TelepülésekOrszág, Állam, Város, Utca, Irányítószám, Szobaszám, Lakosztályszám, Emeletszám
IDTársadalombiztosítási szám, kórlapszám, egészségügyi terv kedvezményezett száma, számlaszám, bizonyítvány/engedélyszám, biometrikus azonosító, nyilvántartási azonosító, belépési szám, járműazonosító szám, rendszám Készülékazonosítók és sorozatszám
KapcsolatTelefonszám, faxszám, e-mail cím, web URL, IP cím

Példa:

25. szeptember 2106-én, délelőtt 11:00 órakor Mr. Harry Pace-t (90 éves) a Forrest Általános Kórházba vették egy tervezett csípőműtétre, amelyet előzőleg orvosa, Dr. Jose Martin konzultált, és Kendra Reith is részt vett rajta. MD. Tartózkodása alatt Mary Hu (NP) és Suzan Ray (RN) felügyelete alatt állt, és R. Charles Melancon (PA) is konzultáltak vele. A felvétellel egy napon végrehajtott műtétje sikeres volt, komplikáció nélkül. A műtétet követően Mr. Pace-t a 202. emelet 2-es szobájába szállították gyógyulás céljából. Felesége, Emma Pace végig jelen volt, és minden szükséges frissítést megkapott. Rövid tartózkodása alatt orvosi feljegyzéseit, köztük az MRN MR99062619-et és a KV000014764-es számlaszámot, a Gracewood Nursing Home, korábbi lakóhelye szabványos protokollja szerint kezelték. Később még aznap az oaklandi ambuláns klinikára bocsátották további gyógyulás céljából. A folyamat során minden eljárást dokumentáltak és biztosítottak a titoktartási előírások betartásával.

Példa: Azonosítatlan

On [Dátumminta], 11:00 órakor, Mr. [Patient Name], idős [Kor], felvették [Az egészségügyi központ neve] tervezett csípőműtétre, amelyet előzetesen az alapellátó orvosa, dr. [Orvos neve], és részt vett [Orvos neve] MD. Ottléte alatt gondozása alatt állt [Gyakorló nővér], NP, és [Gyakorló nővér], RN, vele [Orvos neve], PA, szintén konzultáltak. A felvétellel egy napon végrehajtott műtétje sikeres volt, komplikáció nélkül. A műtétet követően Mr. [Páciens neve] számú szobába helyezték át. [Szoba szám], emelet sz. [Foor Number], gyógyulásért. Felesége, [Családi tag neve] végig jelen volt, és minden szükséges frissítéssel megkapta. Rövid tartózkodása alatt orvosi feljegyzései, köztük az MRN [Orvosi nyilvántartás száma] és Számla [Számlaszám], szabvány protokollja szerint kezelték [Nővérotthon neve], előző lakhelye. Még aznap kiengedték a gondozásba [Klinika neve] további gyógyulásért. A folyamat során minden eljárást dokumentáltak és biztosítottak a titoktartási előírások betartásával.

Annotációs irányelvek és speciális megjegyzéstechnikák

A Shaip fontos szerepet játszott a szabványos adatfeljegyzési irányelvek létrehozásában és végrehajtásában, biztosítva, hogy minden címkézett rekord következetesen és a HIPAA szabványoknak megfelelően készüljön el. Ezen túlmenően 10,000 XNUMX oldalt különféle egészségügyi feljegyzésekből aprólékosan jegyzetekkel elláttak, a negációs állapotok és más klinikailag releváns entitások részletes címkézésére összpontosítva, beleértve a különféle onkológiai alspecialitásokat. Az annotációt az onkológiában és az adatvédelmi szabályozásban szaktudással rendelkező szakértő annotátorokból álló csapat végezte.

Komplex annotációs kritériumok

Kategóriaalkategória
Dátum megjegyzés (onkológia)Diagnózis dátuma, szakasz dátuma, kezdete, eljárás dátuma, közép kezdetének dátuma, középső dátuma befejeződött, besugárzási kezdetének dátuma, besugárzási dátuma befejeződött
Betegség (onkológia)Rákprobléma, Szövettan, Klinikai állapot, Test helye, Viselkedés, Fokozat, Rák stádium, TNM stádium, Tumor marker teszt, Méretek, Kód
Kezelés (onkológia)Rákgyógyászat, Gyógyszeradagolás, Gyakoriság, Ráksebészet, Műtét eredménye, Sugárzási modalitás, Sugárdózis
GenomicsVariációs kód, vizsgált gén, módszer, minta
TagadásNegatív, lehetséges negatív, bizonytalan, lehetséges pozitív
Klinikai NERRák probléma – testhely, szövettan – test helye, viselkedés – test helye, ráksebészet – kapcsolatok testhely, sugárzási mód – testhely, szövettan – fokozat, rákprobléma – méret

Példa:

Onkológiai klinikai megjegyzés

Onkológiai Klinikai Megjegyzés Nyilatkozat

„Jane Doe betegnél IIIB stádiumú nem-kissejtes tüdőrákot (NSCLC), különösen adenokarcinómát diagnosztizáltak 03. A rák a tüdő jobb alsó lebenyében található. A TNM staging rendszer szerint T05N2023M3 besorolású, 2 cm x 0 cm-es daganatmérettel. Az EGFR 5-es exon delécióját a tumorbiopsziás minta PCR-analízisével azonosítottuk. A Carboplatin AUC 3 és 19 mg/m² pemetrexed kemoterápiát 5-án kezdték el, és 500 hetente kell beadni. 03-én megkezdődött a külső sugárterápia (EBRT) 20 Gy dózisban, 2023 frakcióban. A beteg kezelése folyamatban van, és a legutóbbi MRI-n nincs bizonyíték agyi áttétekre. A lymphovascularis invázió lehetőségét még nem határozták meg, és továbbra is bizonytalan, hogy a beteg mennyire tolerálja a teljes kemoterápiás kezelést.

Onkológiai Klinikai Megjegyzés Nyilatkozat

Onkológiai klinikai megjegyzés

Szigorú minőségbiztosítás

Rugalmas projektmenedzsment keretrendszert vezetett be, amely elősegítette az ügyfelek visszajelzéseinek hatékony integrálását, miközben betartotta a szigorú minőségi szabványokat. Átfogó minőségbiztosítási protokollt vezettek be, amely igazodik az irányelvekhez a szükséges minőségi referenciaértékek elérése érdekében. Ez a protokoll egymást követő felülvizsgálati és ellenőrzési köröket tartalmazott, biztosítva a megjegyzésekkel ellátott adatok pontosságát és megbízhatóságát. Az ilyen aprólékos minőségi felügyelet kulcsfontosságú egy megbízható NLP-megoldás kidolgozásában, amely elengedhetetlen a megalapozott klinikai döntéshozatalhoz és a kutatási kiválósághoz.

Eredmény

Sikeresen szállítottunk 10,000 XNUMX kiváló minőségű, azonosítatlan címkézett rekordot, biztonságos és értékes adatkészletet biztosítva az ügyfél NLP-modelljének fejlesztéséhez. Az NLP aprólékos alkalmazása és a HIPAA azonosítás megszüntetésére vonatkozó szabványok betartása egy rendkívül finomított adatkészletet eredményezett, amely alátámasztja a kliens folyamatban lévő és jövőbeli onkológiai kutatási erőfeszítéseit, végső soron az onkológiai betegek kimenetelének és az ellátás hatékonyságának javítását célozva.

A projekt sikere szemlélteti, hogy képesek vagyunk precízen kezelni az összetett egészségügyi adatokat, hozzájárulva az ügyfél azon céljához, hogy javítsák a betegellátás eredményeit és felgyorsítsák az egészségügyi innováció ütemét.

A Shaip-pal kötött partnerségünk nagyban hozzájárult NLP-képességeink fejlesztéséhez az onkológia területén. A 10,000 XNUMX orvosi feljegyzés professzionális kezelése, részletes tagadással és egyéb klinikai entitásokkal igazolta elkötelezettségüket a kiválóság és a megfelelés iránt. Ezen túlmenően a HIPAA-hoz hasonló adatvédelmi szabványok iránti elkötelezettségük felbecsülhetetlen értékű erőforrásokat biztosított számunkra ahhoz, hogy AI-kezdeményezéseinket a legkorszerűbb onkológiai kezelések és diagnosztika fejlesztésére fordítsuk.

Arany-5 csillagos

Gyorsítsa fel Healthcare AI-ját
alkalmazásfejlesztés 100% -ban