One research project, two assessments
Together with other Nordic researchers, we submitted an application to the BEDREHELSE programme in the spring of 2016. The project was divided into three work packages. First, we wanted to investigate a selection of epistemological 'mapping machinery' and how it generates images of people's health. One example of such machinery is Ungdata, a national monitoring tool that produces snapshots of young girls' mental health (4). We then wanted to study the "public health snapshots" themselves, the materialised products of science that describe, for example, public health problems, correlations, causal relationships and the effects of remedies. In the project's third work package, we wanted to study how public health interventions are welcomed, i.e. on both the municipal level and among "ordinary people". What happens when epidemiologically-produced knowledge meets other forms of knowledge, people's beliefs and doubts, and the different ways the target groups live and organise their everyday lives? In other words, we wanted to make knowledge production and public health policy our empirical field and study it within a humanist and social science framework.
The members of the project group come from disciplines such as history of ideas, linguistics, anthropology, science and technology studies, political and power analysis, and sociology. The project positioned itself clearly in the periphery of the invitation of the programme description, and funding would require appreciation of the application's arguments regarding the relevance of the diversity of perspective and methods in public health research.
Three weeks after we submitted the application to the programme, we submitted an identical application to the Research Council's FRIHUMSAM programme. According to the Research Council, this is a thematically 'neutral' programme intended to promote, among other things, "boldness in scientific thinking and innovation" in the humanities and social sciences. In other words, topics related to health are neither prioritised nor excluded in FRIHUMSAM. In November 2016, we were informed of the outcome of both of our applications. They were both rejected, but that is where the similarities between the assessments of the two expert panels end.
Both the BEDREHELSE and FRIHUMSAM expert panels assessed the relevance of the project in relation to the programme announcements. It came as no surprise that the referees for BEDREHELSE assessed its relevance as "weak", granting it a grade of 3 on a scale of 1 to 7, where 7 is the highest grade. Such an assessment of the project's relevance made it clear that further consideration was superfluous.
However, the Research Council's expert panels also assess the "scientific quality" of projects they deem to be of little relevance. In our view, it is the difference between the two panels' assessments of the quality of the projects that leads to the more general question: who are the referees?
The assessment of the BEDREHELSE expert panel was that "the project has not been presented adequately and/or has major qualitative deficiencies. It is not likely that any new knowledge will be generated". The FRIHUMSAM panel's assessment was that "the project's objectives, research questions and hypotheses are very clearly presented and are based on an excellently formulated and highly original project concept".
Here it may be particularly interesting to note the discrepancy in the assessment of the language of the application: "not been presented adequately" versus "very clearly presented". One possible explanation is that different scientific disciplines develop their own "jargon", which can appear to be unclear and confusing for the readers of project descriptions who do not belong to the scientific traditions of which the research projects form part.
The differences in the assessment of "scientific quality" were symptomatic of the assessment of the other criteria. "Project manager and project group", "Implementation plan and resource parameters" and "International collaboration" were all assessed as weak/grade 3 by the referees in the BEDREHELSE programme and as very good/grade 6 in the FRIHUMSAM programme. The same was true of the grading in the "Overall assessment". The disharmony reached its apex in the assessment of "Boldness in scientific thinking and innovation". Here the conclusion of the FRIHUMSAM referees was a very good/grade A, and they wrote: "The project has a very high potential for scientific innovation. It is highly likely to result in substantial theoretical advancement, and/or [...] a radical expansion of knowledge. The project is exceptionally creative". Under the "Impact of the project" criterion, the BEDREHELSE referees wrote: "The project offers no significant benefit". Having been assessed as grade 3, our project was filtered out and never made it to the programme board, according to Pål Kraft, chair of the BEDREHELSE programme board (5).
In table 1, we compare the referees' assessments of a number of the criteria for the two programmes.
Table 1
Comparison of the peer reviews
| Criteria |
FRIHUMSAM |
BEDREHELSE |
| Scientific quality |
The project's objectives, research questions and hypotheses are very clearly presented and are based on an excellently formulated and highly original project concept. The project is in the forefront of its field and will contribute to scientific innovation as well as generate important new knowledge. |
The project has not been presented adequately and/or has major qualitative deficiencies. It is not likely that any new knowledge will be generated. |
| International collaboration |
There is a satisfactory level of international collaboration, and it is of adequate quality. |
The international collaboration activities in the project are weak, and in reality non-existent. |
| Boldness in scientific thinking and innovation Impact of the project |
The project has a very high potential for scientific innovation. It is highly likely to result in substantial theoretical advancement, and/or the development of significantly new methodology and/or a radical expansion of knowledge. The project is exceptionally creative. |
The project offers no significant benefit. |
| Overall assessment |
A project at the highest international level and of the utmost interest nationally and internationally. Publications in leading journals are expected. The researchers are leaders in their field. |
A project in need of comprehensive qualitative improvements. |
Alle som jobber med fagfellevurdering vet at det er vanskelig å vurdere prosjekter og artikler. Vurderingen av vitenskapelig kvalitet vil aldri være objektiv, men derimot basert på fageksperter og fagpanelers beste skjønn. Vårt mål er at graden av tilfeldige utslag blir minst mulig.
Forskerne Rolf Andreas Markussen og Geir Wackers stiller i Tidsskriftet spørsmål knyttet til Forskningsrådets fagfellevurderinger. De spør om programmenes fagfellevurdering hemmer perspektiv- og metodemangfoldet. Analysen er betimelig og setter fingeren på problemstillinger som krever oppmerksomhet. Slik forskerne påpeker, er det spesielt innenfor tverrfaglige områder som for eksempel «folkehelse» at det vitenskapelige perspektivmangfoldet er spesielt betydningsfullt.
Forskerne sendte samme søknad til Forskningsrådets programmer Bedrehelse og Frihumsam, og fikk henholdsvis karakterene 3 og 6 på samme søknad. Bedrehelse-programmet er et handlingsrettet helseforskningsprogram med tematiske og målrettede utlysninger, mens Frihumsam er en åpen arena for forskning innenfor samfunnsvitenskap og humaniora, der alle tema er like aktuelle. Dette vil kunne føre til ulike vurderinger av samme prosjekt og peker på utfordringene med fagfellevurdering i programmer med ulike formål.
Fagpanelene i Forskningsrådet består av internasjonale fageksperter. Panelene oppnevnes på bakgrunn av program og utlysning, og søkerne inviteres til å komme med forslag til fagfeller. Et vesentlig element i fagpanelenes vurdering av søknader er metodikkens hensiktsmessighet for å belyse og gi svar på de forskningsspørsmålene prosjektet stiller. Vurderingen av faglig kvalitet vil alltid vurderes mot en vitenskapelig forskningsfront innen et fagfelt, og vil kunne variere fra ett fagområde til et annet, eller fra én vitenskapstradisjon til en annen. Markussen og Wackers beskriver dette godt med gullet som analogi. Det viktige er å la prosjektet bli vurdert på de faglige premisser og tradisjoner det utgår fra, også om det er tverrfaglig.
Vi ser at prosjekter som ikke svarer på målene i utlysningen, i noen tilfeller også vurderes lavere på vitenskapelig kvalitet av samme panel. Selv om fagfellevurderinger gjøres på grunnlag av gitte kriterier, kan det altså være vanskelig å skille helt mellom de ulike kriteriene som prosjektene vurderes etter. Det er derfor ikke helt uvanlig at ett prosjekt, søkt på en åpen arena og som svar på en utlysning som har helt klare tema og mål, får ulik vurdering også på vitenskapelig kvalitet.
Det er uheldig at søkere sitter igjen med en oppfatning av at vurderingen er tilfeldig, eller faglig innskrenkende. Forskningsrådet er evaluert til å ha gode rutiner for søknadsbehandling, og er i kontinuerlig prosess for å forbedre arbeidet vårt på feltet. Markussen og Wickstrøm peker på viktige utfordringer med fagfellevurderinger i programmer med ulike formål. Synspunktene deres vil være viktige i vårt videre arbeid med å forbedre prosessene for søknadsvurdering. Vi arbeider nå med å samordne de faglige vurderingene i større grad på tvers av våre programmer.
Det har gått en debatt i Aftenposten og i Tidsskriftet om Forskningsrådets vurdering av søknader og manglende kvalitetssikring av vedtak (1,2). Svar fra Forskningsrådet har dessverre vært lite klargjørende (3).
To forskere fra Universitetet i Tromsø gjenga i Tidsskriftet hvordan samme søknad som ble sendt inn til to forskjellige fagpanel i Forskningsrådet, endte opp med to diametralt ulike vurderinger (2). De sprikende vurderingene kunne ikke forklares ut fra formelle eller faglige forhold. Min erfaring er i tråd med forfatternes. Det virker som at Forskningsrådet har for dårlig kvalitetssikring av det samlede arbeid som ekspertpanel og fagkomiteer gjør.
Forskningsrådet fordeler over 9 milliarder kroner årlig og er en av de største bidragsytere til forskning i Norge og helt avgjørende for norsk grunnforskning. Rådets samfunnsoppdrag er å sikre kvalitet og relevans på innsendte prosjektsøknader. I 2015 Forskningsrådet 835 ulike prosjekter innen helseforskning (4). Et ekspertpanel vurderer og rangerer søknadene først, før en fagkomite fatter bevilgningsvedtak basert på ekspertpanelets rangering. Sammensetningen av fagkomiteen og panelene offentliggjøres på Forskningsrådets nettsider, men hvordan disse internasjonale ekspertene velges og hvordan deres habilitet sikres, er uklart.
Min erfaring er at forskningsfelt som mottar mange søknader, har sterkere ekspertrepresentasjon i panelet enn felt med færre søknader. Store forskningsfelt som hjerte-kar- og kreftsykdommer er rimelig godt ivaretatt av ekspertfagfeller, mens innen muskel-skjelettfeltet er fagfellenes kompetanse mer tilfeldig. Dette slår spesielt sterkt ut der søknader fra ulike forskningsfelt konkurrerer, for eksempel innen sektoren «Frimedbio – medisin, helse og biologi» som ikke er programbasert, og der vitenskapelig kvalitet er avgjørende.
Det er trolig grunnen til at et sykdomsfelt som forårsaker betydelige samfunnsutgifter pga. sykefravær, og som påfører helse-Norge større sykehusutgifter enn alle hjerte- karsykdommer tilsammen, nesten ikke mottar forskningsmidler. I Forskningsrådets statistikker for 2015 tildeles forskning innen kreft og hjerte-karlidelser 13-76 ganger større bevilgninger enn muskel- skjelettsykdommer innen alle Forskningsrådets kategorier (4).
Hva kan gjøres? Fagfeller i ekspertpanel med vesentlig ulik bedømmelse av samme prosjekt, må harmonisere sine bedømmelser bedre. Ved fortsatt uenighet må en tredje fagfelle inn for å kvalitetssikre karakteren. Forskningsrådets søknadsbehandling trenger et utenforstående, uavhengig kompetent tilsyn for kvalitetssikring, spesielt innenfor fri prosjektstøtte. Forskningsrådets virksomhet bør bli mer transparent, for eksempel hvordan fagfeller til ekspertpanelene rekrutteres, deres faglige bakgrunn og hvordan habiliteten sikres for de søkere/prosjekter som vurderes. Et brukerutvalg bør gå gjennom Forskningsrådets organisering og ressursbruk regelmessig. Det bør også opprettes en kommunikasjonskanal mellom søker og saksbehandler for å ta opp åpenbare faktafeil og misforståelser i bedømmelsen når den engelske prosjektbeskrivelsen er vurdert som klart formulert. Videre, når et prosjekt går over flere år med dokumentert god utvikling fra et år til neste, må dette fanges opp av Forskningsrådet.
Litteratur
1. Gautvik KM. Folkesykdommene som ikke prioriteres. Aftenposten 03.02.2018 https://www.aftenposten.no/meninger/debatt/i/MgL3AK/Folkesykdommene-som-ikke-prioriteres--Kaare-M-Gautvik (22.05.2018)
2. Markussen RA, Wackers G. Forskningsrådets fagfellevurderinger: Kvalitetssikring eller grensekontroll. Tidsskr nor legeforen 2018 doi: 10.4045/tidsskr.17.0849
3. Gautvik KM. Forskningsrådet misforstår. Aftenposten 15.02.2018. https://www.aftenposten.no/meninger/debatt/i/MgA7ER/Forskningsradet-misforstar--Kaare-M-Gautvik (22.05.2018)
4. Helseforskning finansiert av Norges forskningsråd. Porteføljeanalyse med Health Research Classification System (HRCS) 2015. https://www.forskningsradet.no/no/Publikasjon/Helseforskning_finansiert_av_Norges_forskningsrad/1254019270376?lang=no (22.05.2018)