###### Konfiguration für das Projekt ###### #Pfade PFAD_EXCEL <- "data/Input/" PFAD_OUT <- "data/Output/" PFAD_DB_OUT <- "data/Database/" #Liste der Dateien in denen die Distincts gesucht werden FIND_DISTINCTS_FILES = c("GC3D_Limits_ref.xlsx", "GC3D_Units_ref.xlsx") #Datei in der ersetzt werden soll FILENAME_EXCEL <- "project vocabulary_BB.xlsx" #Name des Excelsheets in der ersetzt werden soll SHEETNAME <- "Projektvokabular" #Spaltennamen(Muster) in denen die Distincts gewerden COLUMN_NAME <- "bibliographicCitation" #Spaltennummer in denen ersetzt werden soll im Excel SPALTEN <- c(10, 11, 12, 13) #Spaltennummer mit der verglichen wird aus Datenbank (citations) INHALTE_DB <- 3 #Spaltennummer der Inhalte die eingesetzt werden soll (uris) ID <- 1 #Zeichenlänge unter der eventuell Zitate automatisch verworfen werden THRESHOLD <- 20 #Match-Variablen, empfohlen wird das Jahr bei fast 1 zu lassen, mit der anderen kann je nach Datenqualität experimentiert werden MATCH_ALL <- 0.8 MATCH_YEAR <- 0.99