Az onkológiai NLP-kutatás fejlesztése
Onkológiai adatok pontossága: Engedélyezés, azonosítás megszüntetése és megjegyzések az NLP-modell-innovációhoz
A rákkezelés forradalmasítása a legmodernebb NLP-technológiákkal
A kliensnek, az egészségügyi ágazat jelentős szereplőjének, fejlett NLP-megoldásra volt szüksége ahhoz, hogy jelentős mennyiségű onkológiai kórlapot feldolgozzon. Az onkológiai kutatások finomítását célzó kulcsfontosságú kezdeményezés részeként a részletes adatelemzés és a szigorú adatvédelmi normák közötti egyensúly megteremtésének szükségessége a legfontosabb. Ez az esettanulmány felvázolja hozzájárulásunkat az ügyfél kutatási törekvéseinek fokozásához a nagy pontosságú adatfeljegyzések, szigorú deazonosítási gyakorlatok és a Natural Language Processing (NLP) technikák alkalmazásával, mindezt a HIPAA által biztosított szabályozási kereteken belül.
kötet
Kihívások
A projekt megkövetelte a klinikai dokumentáció árnyalt megértését, az egészségügyi entitások pontos azonosítását, valamint a tagadó címkék pontos alkalmazásának képességét, mindezt olyan biztonságos kereten belül, amely a HIPAA előírásai szerint védi a betegek adatait. A törekvés nemcsak technikai szakértelmet igényelt nagy mennyiségű összetett adat kezelésében, hanem stratégiai megközelítést is a visszajelzések beépítéséhez és a minőség megőrzéséhez az annotációs folyamat minden szakaszában.
A szolgáltatások részletes leírása
Kategória | Leírás |
Átfogó klinikai adatok lefedettsége | Különféle jegyzettípusokat, gondozási beállításokat és onkológiai alspecialitásokat ölel fel, biztosítva a különböző klinikai forgatókönyveket tükröző, robusztus adatkészletet. |
Szigorú de-azonosítás | Biztosítani kell az összes címkézett rekord azonosítását a HIPAA Safe Harbor módszerével összhangban, ezzel biztosítva az ügyfelek bizalmát az adatok védelme és biztonsága iránt. |
Annotációs irányelvek | Szabványos adatfeljegyzési irányelvek létrehozása és megvalósítása a címkézett rekordok elkészítéséhez a HIPAA szabványokkal összhangban. |
Speciális annotációs stratégiák | 10,000 XNUMX oldalas onkológiával kapcsolatos feljegyzések kézi megjegyzéseit végezték el, részletesen a negációs állapotok és más vonatkozó információk azonosítására összpontosítva, a megállapított irányelveknek megfelelően. |
Szigorú minőségbiztosítás | Teljesítse az irányelvben meghatározott minőségi szabványt |
Megoldás
Megközelítésünk a következő kulcsfontosságú stratégiákat foglalta magában:
Testreszabott onkológiai adatkészlet összeállítása
A több mint 5 milliós EHR-ből álló hatalmas archívumból az adatok gondosan kiválasztott részhalmazát kinyertük, amelynek célja az ügyfelek speciális onkológiai adatok iránti igényeinek kielégítése volt, különös tekintettel a genomikai entitásokra. A gyűjtési folyamat magában foglalta a tumormarkerek, gének, variánsok és TNM-stádiumok kimerítő listájának létrehozását, kulcsszavas keresést alkalmazva az adatokban bővelkedő dokumentumok pontos meghatározásához. A reguláris kifejezéseket számos genetikai variáció és rákstádium azonosítására használták. Ez a megközelítés a különféle dokumentumtípusokat, szakterületeket, gondozási beállításokat és több orvostól származó adatokat átfogó adatlefedettséggel kombinálva átfogó és releváns onkológiai adatkészletet biztosított.
Szigorú de-azonosítás
A folyamat szigorúan betartotta a HIPAA Safe Harbor módszerét az azonosítás megszüntetésére, amely garantálja az ügyfél bizalmát az adatok védelmében és biztonságában. Ez magában foglalja az összes védett egészségügyi információ (PHI) eltávolítását, és címkézett helyőrzőkkel való helyettesítését, ezáltal megőrizve az adatok hasznosságát, miközben megóvja a betegek bizalmas kezelését.
Az azonosítás megszüntetésére szolgáló változók
Kategória | alkategória |
Név | Beteg neve, orvos neve, ápoló neve, családtag neve, orvosi központ neve, klinika neve, ápolási otthon neve, cég neve, egyetem neve |
Kor | |
találka | Dátum minta, hónap év minta, nap hónap minta, nap év minta, nap, hónap, év, évszak |
Települések | Ország, Állam, Város, Utca, Irányítószám, Szobaszám, Lakosztályszám, Emeletszám |
ID | Társadalombiztosítási szám, kórlapszám, egészségügyi terv kedvezményezett száma, számlaszám, bizonyítvány/engedélyszám, biometrikus azonosító, nyilvántartási azonosító, belépési szám, járműazonosító szám, rendszám Készülékazonosítók és sorozatszám |
Kapcsolat | Telefonszám, faxszám, e-mail cím, web URL, IP cím |
Példa:
25. szeptember 2106-én, délelőtt 11:00 órakor Mr. Harry Pace-t (90 éves) a Forrest Általános Kórházba vették egy tervezett csípőműtétre, amelyet előzőleg orvosa, Dr. Jose Martin konzultált, és Kendra Reith is részt vett rajta. MD. Tartózkodása alatt Mary Hu (NP) és Suzan Ray (RN) felügyelete alatt állt, és R. Charles Melancon (PA) is konzultáltak vele. A felvétellel egy napon végrehajtott műtétje sikeres volt, komplikáció nélkül. A műtétet követően Mr. Pace-t a 202. emelet 2-es szobájába szállították gyógyulás céljából. Felesége, Emma Pace végig jelen volt, és minden szükséges frissítést megkapott. Rövid tartózkodása alatt orvosi feljegyzéseit, köztük az MRN MR99062619-et és a KV000014764-es számlaszámot, a Gracewood Nursing Home, korábbi lakóhelye szabványos protokollja szerint kezelték. Később még aznap az oaklandi ambuláns klinikára bocsátották további gyógyulás céljából. A folyamat során minden eljárást dokumentáltak és biztosítottak a titoktartási előírások betartásával.
Példa: Azonosítatlan
On [Dátumminta], 11:00 órakor, Mr. [Patient Name], idős [Kor], felvették [Az egészségügyi központ neve] tervezett csípőműtétre, amelyet előzetesen az alapellátó orvosa, dr. [Orvos neve], és részt vett [Orvos neve] MD. Ottléte alatt gondozása alatt állt [Gyakorló nővér], NP, és [Gyakorló nővér], RN, vele [Orvos neve], PA, szintén konzultáltak. A felvétellel egy napon végrehajtott műtétje sikeres volt, komplikáció nélkül. A műtétet követően Mr. [Páciens neve] számú szobába helyezték át. [Szoba szám], emelet sz. [Foor Number], gyógyulásért. Felesége, [Családi tag neve] végig jelen volt, és minden szükséges frissítéssel megkapta. Rövid tartózkodása alatt orvosi feljegyzései, köztük az MRN [Orvosi nyilvántartás száma] és Számla [Számlaszám], szabvány protokollja szerint kezelték [Nővérotthon neve], előző lakhelye. Még aznap kiengedték a gondozásba [Klinika neve] további gyógyulásért. A folyamat során minden eljárást dokumentáltak és biztosítottak a titoktartási előírások betartásával.
Annotációs irányelvek és speciális megjegyzéstechnikák
A Shaip fontos szerepet játszott a szabványos adatfeljegyzési irányelvek létrehozásában és végrehajtásában, biztosítva, hogy minden címkézett rekord következetesen és a HIPAA szabványoknak megfelelően készüljön el. Ezen túlmenően 10,000 XNUMX oldalt különféle egészségügyi feljegyzésekből aprólékosan jegyzetekkel elláttak, a negációs állapotok és más klinikailag releváns entitások részletes címkézésére összpontosítva, beleértve a különféle onkológiai alspecialitásokat. Az annotációt az onkológiában és az adatvédelmi szabályozásban szaktudással rendelkező szakértő annotátorokból álló csapat végezte.
Komplex annotációs kritériumok
Kategória | alkategória |
Dátum megjegyzés (onkológia) | Diagnózis dátuma, szakasz dátuma, kezdete, eljárás dátuma, közép kezdetének dátuma, középső dátuma befejeződött, besugárzási kezdetének dátuma, besugárzási dátuma befejeződött |
Betegség (onkológia) | Rákprobléma, Szövettan, Klinikai állapot, Test helye, Viselkedés, Fokozat, Rák stádium, TNM stádium, Tumor marker teszt, Méretek, Kód |
Kezelés (onkológia) | Rákgyógyászat, Gyógyszeradagolás, Gyakoriság, Ráksebészet, Műtét eredménye, Sugárzási modalitás, Sugárdózis |
Genomics | Variációs kód, vizsgált gén, módszer, minta |
Tagadás | Negatív, lehetséges negatív, bizonytalan, lehetséges pozitív |
Klinikai NER | Rák probléma – testhely, szövettan – test helye, viselkedés – test helye, ráksebészet – kapcsolatok testhely, sugárzási mód – testhely, szövettan – fokozat, rákprobléma – méret |
Példa:
Onkológiai Klinikai Megjegyzés Nyilatkozat
„Jane Doe betegnél IIIB stádiumú nem-kissejtes tüdőrákot (NSCLC), különösen adenokarcinómát diagnosztizáltak 03. A rák a tüdő jobb alsó lebenyében található. A TNM staging rendszer szerint T05N2023M3 besorolású, 2 cm x 0 cm-es daganatmérettel. Az EGFR 5-es exon delécióját a tumorbiopsziás minta PCR-analízisével azonosítottuk. A Carboplatin AUC 3 és 19 mg/m² pemetrexed kemoterápiát 5-án kezdték el, és 500 hetente kell beadni. 03-én megkezdődött a külső sugárterápia (EBRT) 20 Gy dózisban, 2023 frakcióban. A beteg kezelése folyamatban van, és a legutóbbi MRI-n nincs bizonyíték agyi áttétekre. A lymphovascularis invázió lehetőségét még nem határozták meg, és továbbra is bizonytalan, hogy a beteg mennyire tolerálja a teljes kemoterápiás kezelést.
Onkológiai Klinikai Megjegyzés Nyilatkozat
Szigorú minőségbiztosítás
Rugalmas projektmenedzsment keretrendszert vezetett be, amely elősegítette az ügyfelek visszajelzéseinek hatékony integrálását, miközben betartotta a szigorú minőségi szabványokat. Átfogó minőségbiztosítási protokollt vezettek be, amely igazodik az irányelvekhez a szükséges minőségi referenciaértékek elérése érdekében. Ez a protokoll egymást követő felülvizsgálati és ellenőrzési köröket tartalmazott, biztosítva a megjegyzésekkel ellátott adatok pontosságát és megbízhatóságát. Az ilyen aprólékos minőségi felügyelet kulcsfontosságú egy megbízható NLP-megoldás kidolgozásában, amely elengedhetetlen a megalapozott klinikai döntéshozatalhoz és a kutatási kiválósághoz.
Eredmény
Sikeresen szállítottunk 10,000 XNUMX kiváló minőségű, azonosítatlan címkézett rekordot, biztonságos és értékes adatkészletet biztosítva az ügyfél NLP-modelljének fejlesztéséhez. Az NLP aprólékos alkalmazása és a HIPAA azonosítás megszüntetésére vonatkozó szabványok betartása egy rendkívül finomított adatkészletet eredményezett, amely alátámasztja a kliens folyamatban lévő és jövőbeli onkológiai kutatási erőfeszítéseit, végső soron az onkológiai betegek kimenetelének és az ellátás hatékonyságának javítását célozva.
A projekt sikere szemlélteti, hogy képesek vagyunk precízen kezelni az összetett egészségügyi adatokat, hozzájárulva az ügyfél azon céljához, hogy javítsák a betegellátás eredményeit és felgyorsítsák az egészségügyi innováció ütemét.
A Shaip-pal kötött partnerségünk nagyban hozzájárult NLP-képességeink fejlesztéséhez az onkológia területén. A 10,000 XNUMX orvosi feljegyzés professzionális kezelése, részletes tagadással és egyéb klinikai entitásokkal igazolta elkötelezettségüket a kiválóság és a megfelelés iránt. Ezen túlmenően a HIPAA-hoz hasonló adatvédelmi szabványok iránti elkötelezettségük felbecsülhetetlen értékű erőforrásokat biztosított számunkra ahhoz, hogy AI-kezdeményezéseinket a legkorszerűbb onkológiai kezelések és diagnosztika fejlesztésére fordítsuk.