Zastanawiasz się, jak wydać pracę doktorską, habilitacyjną lub monografie? Chcesz dokonać zmian w stylistyce i interpunkcji tekstu naukowego? Nic prostszego! Zaufaj Wydawnictwu Borgis - wydawcy renomowanych książek i czasopism medycznych. Zapewniamy przede wszystkim profesjonalne wsparcie w przygotowaniu pracy, opracowanie dokumentacji oraz druk pracy doktorskiej, magisterskiej, habilitacyjnej. Dzięki nam nie będziesz musiał zajmować się projektowaniem okładki oraz typografią książki.

© Borgis - Nowa Medycyna 4/1999, s. 59-62
Maciej Chwaliński
Kontrolowane badania kliniczne, możliwości i potencjalne błędy
Controled clinical trials: possibilities and potential errors
z Kliniki Nowotworów Jelita Grubego Centrum Onkologii – Instytutu im. Marii Skłodowskiej-Curie w Warszawie
Kierownik Kliniki: prof. dr hab. med. Marek P. Nowacki
Słowa kluczowe: badania kliniczne, badania losowe.
Badania kliniczne już od ponad 40 lat stanowią podstawę oceny nowych leków i sposobów leczenia, a w okresie tym zwiększyła się zarówno ich liczba jak i złożoność. Obecnie podstawową formą badań klinicznych są randomizowane badania kliniczne, a ich prekursorem było badanie w 1948 r. mające na celu ocenę skuteczności streptomycyny w leczeniu gruźlicy płuc. Badania kliniczne tego typu, jeśli są prawidłowo zaprojektowane i wykonane, pozwalają na osiągnięcie powtarzalnych i rzetelnych wyników. Rondomizowane badania kliniczne polegają na losowym doborze chorych do badanych sposobów leczenia. Pozwala to na osiągnięcie grup chorych leczonych różnymi metodami, jednakże o porównywalnych cechach demograficznych, klinicznych i innych, uwzględniających czynniki mogące mieć potencjalny wpływ na wynik leczenia. W przypadku zastosowania klasycznych mechanizmów randomizacji, ani pacjent ani lekarz, nie znają sposobu leczenia przed rozpoczęciem badania. Uśrednienie grup chorych i osiągnięcie możliwie podobnego rozkładu potencjalnych czynników rokowniczych w każdej z leczonych grup pozwala na uniknięcie mylnych wyników spowodowanych heterogennością populacji pacjentów. W przeciwieństwie do doświadczeń np. w fizyce, gdzie obiekty poddawane ocenie są homogenne, w medycynie osiągnięcie homogennej populacji badanych obiektów jest niemożliwe. Dodatkowo, zmienność populacji wynika również ze zmienności odpowiedzi na leczenie i trudności z osiągnięciem idealnej powtarzalności zastosowanego schematu leczenia, np. zmienności w czasach podawania leku. Wielu lekarzy odczuwa jednak opory przed losowym wybieraniem sposobu leczenia. Również, pacjenci po uzyskaniu wyniku randomizacji mogą odmówić leczenia, a nawet utracić zaufanie do lekarza. Jednak w przypadku leczenia nowotworów złośliwych, tylko niewielki odsetek metod leczenia daje znamienne korzyści terapeutyczne, a więc wyleczenie wysokiego odsetka pacjentów. Ponadto daleko jeszcze do pełnego poznania patogenezy w tak bogatej i różnorodnej grupie chorób, jak choroby nowotworowe. Tak więc, randomizowane badania kliniczne pozostają jedną z najbardziej wiarygodnych metod porównywania wyników leczenia uzyskiwanych różnymi metodami.
Randomizacja pozwala na uniknięcie wielu potencjalnych błędów w doborze populacji chorych, prowadzeniu leczenia i analizie danych. Jeśli zaniecha się metody losowego doboru chorych i dokonuje się porównań retrospektywnych, a więc o znaczeniu historycznym możliwe jest popełnienie następujących ważniejszych błędów:
1. Błąd doboru chorych przez lekarza – dobór pacjentów, przeprowadzony przez lekarza, do nowego sposobu leczenia może być nieobiektywny.
2. Błąd doboru leczenia przez chorego – w przypadku badań, w których pacjenci mogą sami dobierać leczenie, co nie miało miejsca w przypadku grupy leczonej historycznie.
3. Błąd rozpoznania i oceny stopnia zaawansowania – metody stosowane do ustalenia rozpoznania i oceny stopnia zaawansowania muszą być identyczne. Ma to zwłaszcza szczególne znaczenie w przypadku porównania do grupy historycznej.
4. Leczenie wspomagające jest również źródłem potencjalnych błędów w ocenie wyników. Leczenie to powinno być identyczne dla obu grup chorych, ponieważ może wpływać na odległy wynik leczenia.
5. Metody oceny odzwierciedlają jakość uzyskanych danych. Jeżeli metody stosowane dla oceny wyników są różne to porównanie może być trudne do przeprowadzenia lub wręcz niemożliwe.
6. Czynniki rokownicze o największym znanym znaczeniu muszą być identyczne w przypadku obu grup.
Jednakże również badania randomizowane mogą nie ustrzec się od potencjalnych błędów, wewnętrznie związanych z projektem badania. Często zdarza się, że już po randomizacji okazuje się, że pewien odsetek pacjentów nie spełnia kryteriów włączania do badania. W większości takich przypadków prowadzący badanie decyduje o wyłączeniu tych osób z badania. Lecz, czy to rozumowanie jest uzasadnione? Jeżeli w ocenie przed włączeniem do badania pacjenci ci wydawali się spełniać kryteria to możliwym jest, że w grupie spełniających chwilowo kryteria włączenia jest pewna liczba chorych w zasadzie tych kryteriów nie spełniająca. Najrozsądniejszym wyjściem jest zatem zmiana protokołu badania, lub nie zezwolenie na wyłączenia z leczenia po przeprowadzeniu randomizacji. Tak więc wyłączenie chorych z badania po randomizacji powinno być ograniczone wyłącznie do przypadków spowodowanych czynnikami w pełni niezależnymi od autorów projektu. Poza tym częstym błędem popełnianym w ocenie badań klinicznych jest przyjmowanie braku statystycznie znamiennej różnicy pomiędzy sposobem leczenia jako braku faktycznej różnicy. Należy brać pod uwagę liczbę leczonych osób i planową korzyść ze stosowanego leczenia. Zakładając, że jeden ze sposobów leczenia zapewnia poprawę przeżyć o 5% to badanie kliniczne przeprowadzone na 200 chorych nie jest w stanie wykazać tej różnicy w sposób statystycznie znamienny. Dopiero po włączeniu do badania 2000 chorych możemy spodziewać się osiągnięcia znamienności statystycznej, nie z powodów medycznych, lecz wyłącznie statystycznych. Najczęściej popełnianym błędem w analizie statystycznej badań klinicznych jest tzw. błąd typu I. Jest to założenie, że różnica w wynikach pomiędzy różnymi grupami leczenia jest znamienna statystycznie (błąd fałszywie dodatni). Drugiego typu błędem jest błąd typu II, lub fałszywie ujemny, w przypadku którego badanie nie wykrywa różnicy mimo, że one faktycznie istnieją. Choć błąd typu II odpowiedzialny jest za brak wykazania przez wiele badań klinicznych skuteczności leczenia, to w praktyce rzadko się go poszukuje. Po ponownym przeanalizowaniu wyników 71 badań klinicznych opublikowanych w znaczących pismach o zasięgu światowym przed 1977 r. wykazano że, w przypadku 67 badań ryzyko nie zaobserwowania 25% poprawy w wynikach leczenia wynosiło 10% lub więcej, a w przypadku 50 z nich takie samo ryzyko dotyczyło 50% poprawy. Wiele sposobów leczenia nie mogło być poddanych rzetelnej analizie z powodu mało liczebnej grupy badanych. Jeszcze mniej uwagi poświęca się interpretacji pozytywnych wyników badań klinicznych. Np. jak korzystny musi być wynik zanim zostanie powszechnie zaakceptowany, a nowy sposób leczenia wprowadzony do powszechnej praktyki? Jest to złożone zagadnienie, które obejmuje między innymi takie problemy jak:
– reprezentacyjność pacjentów poddanych ocenie;
– opinie lekarzy (przed rozpoczęciem badania) na temat znaczenia i skuteczności nowego leczenia;
– kliniczne znaczenie obserwowanej korzyści (np. poprawa jakości życia przy nieznacznie gorszej skuteczności leczenia jest wynikiem nie uzasadniającym szerokiego stosowania leczenia tego typu);
– ocena opłacalności nowego sposobu leczenia.
Ponadto należy pamiętać, że sam postęp w technikach diagnostycznych może być potencjalnym źródłem błędów w analizie badań klinicznych. Doskonałym przykładem może tu być pojęcie fenomenu Willa Rogersa. W badaniu mającym na celu porównanie wyników leczenia raka płuca w roku 1977 i w latach 1953-1964 przeprowadzonym w Stanach Zjednoczonych stwierdzono, że poprawa wyników leczenia jest głównie wynikiem artefaktu statystycznego. Wprowadzenie w latach siedemdziesiątych nowych metod diagnostycznych i ulepszenie już istniejących spowodowało, że rozpoznanie zmian przerzutowych następowało na etapie bezobjawowym i znacznie wcześniej niż było to uprzednio możliwe. W rezultacie osoby z utajonymi przerzutami nie były klasyfikowane, jak w latach 1953-64, do grupy o dobrym rokowaniu, ale do grupy o niekorzystnym rokowaniu. Ponieważ stan tej grupy chorych był znacznie lepszy niż grupy chorych z klinicznie jawnymi przerzutami, to przeżycia w tej grupie uległy poprawie. Eliminacja chorych z niejawnymi przerzutami z grupy chorych o dobrym rokowaniu, pozwoliła na poprawę rokowania w grupie chorych o korzystnym rokowaniu. Jednakże, analizując wszystkich chorych nie doszło do poprawy w wynikach leczenia. Parafrazując stwierdzenie Willa Rogersa, amerykańskiego humorysty i filozofa, można ten przykład zilustrować stwierdzeniem, że „mieszkańcy Warszawy przeprowadzający się do Krakowa podnoszą średni współczynnik inteligencji w obu miastach”. Efekt ten nie jest spowodowany poprawą naszych metod leczenia, lecz jedynie i wyłącznie wynikiem odmiennie przeprowadzonej analizy chorych w oparciu o nowo dostępne techniki diagnostyczne. Ten sam efekt obserwowano również przy historycznych porównaniach wyników leczenia mięsaka kościotwórczego.
Analizując postęp w leczeniu nowotworów złośliwych obserwujemy, że poprawa w wynikach leczenia następowała bardzo stopniowo. Wprowadzenie każdej z nowych metod leczenia pozwoliło na poprawę wyników o kilka, co najwyżej kilkanaście procent. Przy tak niewielkich różnicach w wynikach uzyskiwanych poszczególnymi sposobami leczenia ważne dla lekarza praktyka stają się zagadnienia oboczne, a nie tylko wynik leczenia. Wiele obecnie prowadzonych badań zajmuje się zagadnieniem jakości życia chorych poddawanych różnym sposobom leczenia onkologicznego. Wiele instytucji odpowiedzialnych za badania kliniczne na ludziach (w tym np. Food and Drug Administration w Stanach Zjednoczonych) wręcz wymaga, aby ocena jakości życia stanowiła część proponowanych badań klinicznych mających na celu określenie skuteczności leczenia. Choć ocena jakości życia w przypadkach wysoce skutecznych metod leczenia jest etycznie mało uzasadniona, to w przypadkach, gdy potencjalna korzyść z leczenia może wynieść kilka procent, jest jak najbardziej słuszna. W przypadkach gdy nowy sposób leczenia, daje np. czterokrotnie wyższą skuteczność niż dotychczasowe sposoby leczenia, powstrzymywanie się od zastosowania tego leczenia wyłącznie w oparciu o fakt, iż leczenie to może spowodować pogorszenie jakości życia nie jest uzasadnione. Jednakże w przypadku bardzo niewielkich korzyści płynących, z zastosowania nowych sposobów leczenia może być istotne „dodanie życia do lat, a nie lat do życia”. Choć może nie jest to etycznie proste, to jednak również koszty związane z leczeniem i opieką nad chorymi stają się coraz bardziej istotne w ocenie nowych schematów leczenia. Leczenie bardzo drogie, i tylko nieco bardziej skuteczne, ma mniejsze szanse na szeroką akceptację i zastosowanie niż leczenie tańsze i tylko niewiele mniej skuteczne. Podobnie jest z leczeniem powodującym toksyczność i leczeniem mniej toksycznym.
Znacznie bardziej złożonym zagadnieniem jest zastosowanie badań klinicznych w ocenie sposobów leczenia chirurgicznego, a jeszcze bardziej złożonym wydaje się być porównanie leczenia zachowawczego z leczeniem operacyjnym. W przeciwieństwie do badań klinicznych poświęconych leczeniu zachowawczemu, w których lekarz może po prostu zaprzestać stosowania leku lub zastosować nowy, to w przypadku badań klinicznych w chirurgii, wymogi badania klinicznego mogą spowodować niezastosowanie sposobu leczenia operacyjnego o udowodnionej skuteczności i zastąpienie go innym o nieznanej skuteczności, lub wręcz ograniczenie się do leczenia zachowawczego. Dodatkowo może okazać się koniecznym wyszkolenie chirurga do wykonywania nowego typu zabiegu operacyjnego, którego nigdy przedtem nie wykonywał i przy wykonywaniu którego nie czuje się pewnie. W takich przypadkach, poza oceną wczesnej śmiertelności i liczby powikłań dla udowodnienia skuteczności nowej metody niezbędny jest bardzo długi okres obserwacji katamnestycznych.
Badania kliniczne porównujące leczenie zachowawcze z leczeniem operacyjnym obarczone są dodatkową problematyką. Po pierwsze przekonania lekarzy kierujących pacjentów mogą mieć wpływ na ich dobór do badania. Zjawisko to obserwowano w czasie pierwszych prób randomizowanej oceny skuteczności pomostowania aortalno-wieńcowego w porównaniu do leczenia zachowawczego. W badaniu przeprowadzonym w Uniwersytecie Stanu Oregon w początku lat siedemdziesiątych, zaobserwowano nagły odpływ chorych do klinik prywatnych. Kliniki te oferowały leczenie operacyjne w przeciwieństwie do Szpitala Uniwersyteckiego, który proponował losowy dobór chorych albo do leczenia operacyjnego albo zachowawczego. Podobne problemy mogą występować w przypadku propozycji zabiegów operacyjnych o różnym stopniu okaleczenia, a co za tym idzie powodujących napięcie emocjonalne, np. w przypadku porównania mastektomii do zabiegów oszczędzających w raku piersi. Wprowadzenie nowych technik operacyjnych w ramach badania klinicznego musi opierać się o ściśle określone kryteria włączenia nie pozwalające na zbyt swobodny dobór chorych przez lekarzy biorących udział w badaniu. Naturalną tendencją jest oferowanie nowego sposobu leczenia osobom w najlepszym stanie ogólnym i entuzjastycznie nastawionych do nowego sposobu leczenia. W wyniku tego populacja badana może znacznie odbiegać w swojej charakterystyce od ogółu populacji chorych. Sprowadzając ten problem do absurdu można stwierdzić, iż przy wadliwie określonych kryteriach włączenia, mało prawdopodobnym byłoby udowodnienie teratogenności talidomidu ze względu na niski odsetek ciężarnych w populacji. Analiza statystyczna wyników badań klinicznych porównujących leczenie operacyjne z zachowawczym jest złożona i sama jako taka może również być źródłem rażących błędów. Najczęstszym źródłem błędu jest stosowanie odmiennego sposobu leczenia niż przypisany. W badaniu nad pomostowaniem aortalno-wieńcowym w porównaniu do leczenia zachowawczego przeprowadzonym przez Veterans Administration Cooperative Study of Coronary Bypass, 17% chorych leczonych zachowawczo poddano leczeniu operacyjnemu z powodu nie ustąpienia objawów. Wszystkie zgony u tych chorych zaliczono na poczet leczenia operacyjnego. Nie dziwi więc fakt, że badanie to po 30-miesięcznym okresie obserwacji wykazało, że zastosowanie pomostowania nie wydłuża życia!!!
Planując randomizowane badanie kliniczne w chirurgii nadzwyczaj ważnym dla jego wartości klinicznej i naukowej jest przestrzeganie następujących zasad:
1. Pacjenci wprowadzani do badania muszą być reprezentatywni dla całej populacji.
2. Przydział pacjentów do poszczególnych sposobów leczenia, lub ich wyłączenie z badania, musi opierać się na obiektywnych lub ilościowych kryteriach, a nie na subiektywnej ocenie klinicznej.
3. Wszystkie powikłania, które występują po przydziale leczenia powinny być przypisywane stosowanemu leczeniu, nawet jeśli leczenia tego jeszcze nie zastosowano.
4. Liczba pacjentów musi być wystarczająco duża, ryzyko nie leczonej choroby duże, a okres obserwacji wystarczająco długi, aby wykryć ważne różnice w rokowaniu i uniknąć błędu typu II.
5. Pacjentów nie należy wyłączać z badania tylko dlatego, że nie uzyskają korzyści z zastosowanego leczenia.
6. Nie należy poddawać ocenie procedur, z którymi zespół operacyjny nie jest zaznajomiony. Należy zadbać o to aby okres „szkolenia” był odpowiedni i dopiero po tym rozpocząć badanie.
7. Należy wziąć pod uwagę fakt, iż przy porównywaniu tak różnych sposobów postępowania jak leczenie zachowawcze i leczenie operacyjne, tylko w niezwykłych okolicznościach udaje się takie badanie zaprojektować i wykonać bezbłędnie. Tylko bardzo nieliczne badania tego typu miały istotny wpływ na zmianę sposobów leczenia.
We wszystkich badaniach klinicznych niezbędnym elementem przy projektowaniu i analizie wyników jest ścisła współpraca klinicysty ze statystykiem. Współpraca ta może pozwolić na uniknięcie błędów, które mimo niekiedy bardzo znacznych nakładów, spowodowałyby niepowodzenie doświadczenia.
Wydaje się, że obecne poglądy pozwalają na stwierdzenie, że badanie kliniczne o potencjalnie największej korzyści dla pacjentów posiada następujące cechy.
1. ważność – jego wyniki są prawdziwe,
2. powszechność – jego wyniki mogą być szeroko stosowane,
3. skuteczność – wyniki są opłacalne.
Ponieważ pierwsza cecha jest bezwarunkowa, stąd też znakomita większość badań prowadzonych współcześnie ma charakter badań randomizowanych.
Zastosowanie wyników badań klinicznych zależne jest od skumulowanych dowodów dostarczonych przez to badanie i badania pokrewne. Klinicysta powinien ostrożnie podchodzić do przedstawionych wyników, upewniając się, że korzyści płynące z zastosowania konkretnego typu leczenia przewyższają jego ryzyko, jakie jest z nim związane. Ponadto należy zawsze rozważyć, czy populacja, którą mamy leczyć nowym sposobem, nie jest odmienna od populacji leczonej uprzednio w kontrolowanym badaniu klinicznym.
Zmiany sposobów leczenia w nowoczesnej medycynie nie odbywają się drogą przemian rewolucyjnych, toteż zdani jesteśmy na stopniowe i bardzo powolne poprawienie wyników leczenia. Przy takiej mnogości metod i ich modyfikacji, wyników, czy małych różnicach toksyczności, potrzeba nam teraz bardziej niż kiedykolwiek, rzetelnych, wiarygodnych i jednoznacznych informacji na te tematy, jak również na temat powikłań, jakości życia chorych i kosztów zastosowanych sposobów leczenia. Tak więc jedynym źródłem dla uzyskania wiarygodnych wyników w medycynie jest przeprowadzenie kontrolowanych badań klinicznych, najlepiej o charakterze randomizowanym. Badania tego typu nie są bezbłędne, lecz po zdaniu sobie sprawy z możliwości błędów, wydaje się, że przy współpracy klinicystów z zespołem statystycznym, przy wyrzeczeniu się własnych uprzedzeń, czy dobrze ugruntowanych poglądów, możliwym jest zaprojektowanie badania klinicznego odpowiadającego w sposób wiarygodny na pytanie związane z konkretnym problemem klinicznym. Przy stale zwiększającej się liczbie publikacji na temat badań klinicznych i ich wyników oraz coraz większej złożoności problematyki poruszanej w piśmiennictwie, naszym zdaniem warto pamiętać o wyżej, siłą rzeczy skrótowo, przytoczonych zasadach postępowania. Należy również podkreślić, iż przy braku innych, racjonalnych rozwiązań, randomizowane badania kliniczne pozostają i na pewno na długo jeszcze pozostaną jedyną wiarygodną metodą oceny nowych metod leczenia, uzasadnioną zarówno z etycznego, jak i ekonomicznego punktu widzenia.
Piśmiennictwo
1. Bonchek L.I.: The role of the randomised Clinical Trial in the evaluation of new operations. Surg. Clin. North Am. 1982, 62, 4:761-766. 2.Burzykowski T.: Podstawowe zagadnienia i metody organizacji badań klinicznych chorób nowotworowych. Nowotwory 1996, 46:11-35. 3. Feinstein A.R. et al.:The Will Rogers Phenomenon. Stage migration and new diagnostic techniques as a source of misleading statistics for survival in cancer. New. Eng. J. Med. 1985, 312:1604-1608. 4. Medical Research Council: Streptomycin treatment in pulmonary tuberculosis. Br. J. Med. 1948, 2:769. 5. Parmar M.K.: Pitfalls and biases in the reporting and interpretation of the results of clinical trials. Lung Cancer 1994, 10, S1:143-50. 6. Pocock S.J.: Current issues in the design and interpretation of clinical trials. B. M. J. 1985, 290:39-42. 7. Rosner F.: The ethics of randomised clinical trials. Am. J. Med. 1987, 82:283-90. 8. Siedlecki P.: Kontrolowane doświadczenia kliniczne: punkt widzenia lekarza praktyka. Nowotwory, 1996, 46:36-40. 9. Van der Linder W.: Pitfalls in randomized surgical trials. Surgery 1980, 87:258-62. 10. Zelen M.: Alternatives to classic randomized trials. Surg. Clin. North Am. 1981, 61, 6:1425-1432.
Nowa Medycyna 4/1999
Strona internetowa czasopisma Nowa Medycyna