add lex.h and lex.c except next_token
This commit is contained in:
@@ -1,30 +1,35 @@
|
|||||||
#pragma once
|
#pragma once
|
||||||
|
#include <stdint.h>
|
||||||
|
|
||||||
typedef enum {
|
typedef enum {
|
||||||
LBRACK,
|
LBRACK,
|
||||||
RBRACK,
|
RBRACK,
|
||||||
LCURLY,
|
LCURLY,
|
||||||
RCURLY,
|
RCURLY,
|
||||||
|
LPAREN,
|
||||||
|
RPAREN,
|
||||||
|
|
||||||
ID,
|
|
||||||
SEMI,
|
SEMI,
|
||||||
COMMA,
|
COMMA,
|
||||||
ARROW,
|
ARROW,
|
||||||
STAR,
|
STAR,
|
||||||
|
ANDREF,
|
||||||
|
DOLLAR,
|
||||||
|
|
||||||
COMMENT,
|
COMMENT,
|
||||||
|
ID,
|
||||||
NUM,
|
NUM,
|
||||||
|
STRING_LITERAL,
|
||||||
|
|
||||||
RETURN,
|
RETURN,
|
||||||
IF,
|
IF,
|
||||||
ELSE,
|
ELSE,
|
||||||
|
|
||||||
STRING_LITERAL,
|
|
||||||
|
|
||||||
ERROR
|
ERROR
|
||||||
} TokenType;
|
} TokenType;
|
||||||
|
|
||||||
typedef struct {
|
typedef struct {
|
||||||
TokenType type;
|
TokenType type;
|
||||||
char *data;
|
char *data;
|
||||||
int line;
|
uint32_t line;
|
||||||
} Token;
|
} Token;
|
||||||
|
|||||||
@@ -0,0 +1,39 @@
|
|||||||
|
#pragma once
|
||||||
|
|
||||||
|
#include <stdint.h>
|
||||||
|
#include <stdio.h>
|
||||||
|
#include <stdlib.h>
|
||||||
|
|
||||||
|
#include "globals.h"
|
||||||
|
|
||||||
|
#define LEX_BUF_SIZE 4096
|
||||||
|
|
||||||
|
typedef struct Lexer {
|
||||||
|
uint32_t linepos;
|
||||||
|
uint32_t lineno;
|
||||||
|
|
||||||
|
FILE *source;
|
||||||
|
|
||||||
|
int flag_EOF;
|
||||||
|
|
||||||
|
char *buffer;
|
||||||
|
char *curr;
|
||||||
|
|
||||||
|
size_t bytes_in_buffer;
|
||||||
|
} Lexer;
|
||||||
|
|
||||||
|
Lexer *new_lexer();
|
||||||
|
|
||||||
|
void lexer_set_source(Lexer *lexer, FILE *source);
|
||||||
|
|
||||||
|
void lexer_fill_buffer(Lexer *lexer);
|
||||||
|
|
||||||
|
void lexer_consume(Lexer *lexer);
|
||||||
|
|
||||||
|
char lexer_curr(Lexer *lexer);
|
||||||
|
|
||||||
|
char lexer_peek(Lexer *lexer);
|
||||||
|
|
||||||
|
Token lexer_next_token(Lexer *lexer);
|
||||||
|
|
||||||
|
void free_lexer(Lexer *lexer);
|
||||||
|
|||||||
78
src/lex.c
78
src/lex.c
@@ -0,0 +1,78 @@
|
|||||||
|
#include "lex.h"
|
||||||
|
|
||||||
|
Lexer *new_lexer() {
|
||||||
|
Lexer *lexer = malloc(sizeof(Lexer));
|
||||||
|
|
||||||
|
lexer->linepos = 0;
|
||||||
|
lexer->lineno = 0;
|
||||||
|
|
||||||
|
lexer->source = NULL;
|
||||||
|
|
||||||
|
lexer->flag_EOF = 0;
|
||||||
|
|
||||||
|
lexer->buffer = calloc(LEX_BUF_SIZE, sizeof(char));
|
||||||
|
lexer->curr = lexer->buffer;
|
||||||
|
lexer->buffer[0] = '\0';
|
||||||
|
}
|
||||||
|
|
||||||
|
void lexer_set_source(Lexer *lexer, FILE *source) {
|
||||||
|
lexer->lineno = 0;
|
||||||
|
lexer->linepos = 0;
|
||||||
|
|
||||||
|
lexer->source = source;
|
||||||
|
}
|
||||||
|
|
||||||
|
void lexer_fill_buffer(Lexer *lexer) {
|
||||||
|
if (lexer->flag_EOF) {
|
||||||
|
return;
|
||||||
|
}
|
||||||
|
size_t bytes_read;
|
||||||
|
if (*lexer->curr == 0) {
|
||||||
|
bytes_read = fread(lexer->buffer, sizeof(char), LEX_BUF_SIZE, lexer->source);
|
||||||
|
if (bytes_read < LEX_BUF_SIZE) {
|
||||||
|
lexer->flag_EOF = 1;
|
||||||
|
lexer->buffer[bytes_read] = '\0';
|
||||||
|
}
|
||||||
|
lexer->bytes_in_buffer = bytes_read;
|
||||||
|
} else {
|
||||||
|
char tmp = lexer->buffer[LEX_BUF_SIZE - 1];
|
||||||
|
bytes_read = fread(lexer->buffer, sizeof(char), LEX_BUF_SIZE - 1, lexer->source + 1);
|
||||||
|
lexer->buffer[0] = tmp;
|
||||||
|
if (bytes_read < LEX_BUF_SIZE - 1) {
|
||||||
|
lexer->flag_EOF = 1;
|
||||||
|
lexer->buffer[1 + bytes_read] = '\0';
|
||||||
|
}
|
||||||
|
lexer->bytes_in_buffer = bytes_read + 1;
|
||||||
|
}
|
||||||
|
|
||||||
|
lexer->curr = lexer->buffer;
|
||||||
|
}
|
||||||
|
|
||||||
|
void lexer_consume(Lexer *lexer) {
|
||||||
|
size_t read = lexer->curr - lexer->buffer;
|
||||||
|
if (read >= lexer->bytes_in_buffer) {
|
||||||
|
return;
|
||||||
|
}
|
||||||
|
if (read == LEX_BUF_SIZE - 2) {
|
||||||
|
lexer_fill_buffer(lexer);
|
||||||
|
} else {
|
||||||
|
lexer->curr++;
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
char lexer_curr(Lexer *lexer) {
|
||||||
|
return *(lexer->curr);
|
||||||
|
}
|
||||||
|
|
||||||
|
char lexer_peek(Lexer *lexer) {
|
||||||
|
return *(lexer->curr + 1);
|
||||||
|
}
|
||||||
|
|
||||||
|
Token lexer_next_token(Lexer *lexer) {
|
||||||
|
// TODO: implement
|
||||||
|
}
|
||||||
|
|
||||||
|
void free_lexer(Lexer *lexer) {
|
||||||
|
free(lexer->buffer);
|
||||||
|
free(lexer);
|
||||||
|
}
|
||||||
Reference in New Issue
Block a user