minor update

2025-04-23 21:39:10 -04:00 · 2024-06-03 20:39:16 -07:00 · 2024-06-03 20:39:16 -07:00 · 6b800f2054
commit 6b800f2054
parent a7fac99fd9
1 changed files with 20 additions and 27 deletions
--- a/kernel/include/vx_intrinsics.h
+++ b/kernel/include/vx_intrinsics.h
@ -103,17 +103,17 @@ extern "C" {

 // Set thread mask
 inline void vx_tmc(size_t thread_mask) {
-    asm volatile (".insn r %0, 0, 0, x0, %1, x0" :: "i"(RISCV_CUSTOM0), "r"(thread_mask));
+    __asm__ volatile (".insn r %0, 0, 0, x0, %1, x0" :: "i"(RISCV_CUSTOM0), "r"(thread_mask));
 }

 // disable all threads in the current warp
 inline void vx_tmc_zero() {
-    asm volatile (".insn r %0, 0, 0, x0, x0, x0" :: "i"(RISCV_CUSTOM0));
+    __asm__ volatile (".insn r %0, 0, 0, x0, x0, x0" :: "i"(RISCV_CUSTOM0));
 }

 // switch execution to single thread zero
 inline void vx_tmc_one() {
-    asm volatile (
+    __asm__ volatile (
        "li a0, 1\n\t"  // Load immediate value 1 into a0 (x10) register
        ".insn r %0, 0, 0, x0, a0, x0" :: "i"(RISCV_CUSTOM0) : "a0"
    );
@ -121,116 +121,109 @@ inline void vx_tmc_one() {

 // Set thread predicate
 inline void vx_pred(int condition, int thread_mask) {
-    asm volatile (".insn r %0, 5, 0, x0, %1, %2" :: "i"(RISCV_CUSTOM0), "r"(condition), "r"(thread_mask));
+    __asm__ volatile (".insn r %0, 5, 0, x0, %1, %2" :: "i"(RISCV_CUSTOM0), "r"(condition), "r"(thread_mask));
 }

 // Set thread not predicate
 inline void vx_pred_n(int condition, int thread_mask) {
-    asm volatile (".insn r %0, 5, 0, x1, %1, %2" :: "i"(RISCV_CUSTOM0), "r"(condition), "r"(thread_mask));
+    __asm__ volatile (".insn r %0, 5, 0, x1, %1, %2" :: "i"(RISCV_CUSTOM0), "r"(condition), "r"(thread_mask));
 }

 // Spawn warps
 typedef void (*vx_wspawn_pfn)();
 inline void vx_wspawn(size_t num_warps, vx_wspawn_pfn func_ptr) {
-    asm volatile (".insn r %0, 1, 0, x0, %1, %2" :: "i"(RISCV_CUSTOM0), "r"(num_warps), "r"(func_ptr));
+    __asm__ volatile (".insn r %0, 1, 0, x0, %1, %2" :: "i"(RISCV_CUSTOM0), "r"(num_warps), "r"(func_ptr));
 }

 // Split on a predicate
 inline int vx_split(int predicate) {
    size_t ret;
-    asm volatile (".insn r %1, 2, 0, %0, %2, x0" : "=r"(ret) : "i"(RISCV_CUSTOM0), "r"(predicate));
+    __asm__ volatile (".insn r %1, 2, 0, %0, %2, x0" : "=r"(ret) : "i"(RISCV_CUSTOM0), "r"(predicate));
    return ret;
 }

 // Split on a not predicate
 inline int vx_split_n(int predicate) {
    size_t ret;
-    asm volatile (".insn r %1, 2, 0, %0, %2, x1" : "=r"(ret) : "i"(RISCV_CUSTOM0), "r"(predicate));
+    __asm__ volatile (".insn r %1, 2, 0, %0, %2, x1" : "=r"(ret) : "i"(RISCV_CUSTOM0), "r"(predicate));
    return ret;
 }

 // Join
 inline void vx_join(int stack_ptr) {
-    asm volatile (".insn r %0, 3, 0, x0, %1, x0" :: "i"(RISCV_CUSTOM0), "r"(stack_ptr));
+    __asm__ volatile (".insn r %0, 3, 0, x0, %1, x0" :: "i"(RISCV_CUSTOM0), "r"(stack_ptr));
 }

 // Warp Barrier
 inline void vx_barrier(int barried_id, int num_warps) {
-    asm volatile (".insn r %0, 4, 0, x0, %1, %2" :: "i"(RISCV_CUSTOM0), "r"(barried_id), "r"(num_warps));
+    __asm__ volatile (".insn r %0, 4, 0, x0, %1, %2" :: "i"(RISCV_CUSTOM0), "r"(barried_id), "r"(num_warps));
 }

 // Return current thread identifier
 inline int vx_thread_id() {
    int ret;
-    asm volatile ("csrr %0, %1" : "=r"(ret) : "i"(VX_CSR_THREAD_ID));
+    __asm__ volatile ("csrr %0, %1" : "=r"(ret) : "i"(VX_CSR_THREAD_ID));
    return ret;
 }

 // Return current warp identifier
 inline int vx_warp_id() {
    int ret;
-    asm volatile ("csrr %0, %1" : "=r"(ret) : "i"(VX_CSR_WARP_ID));
+    __asm__ volatile ("csrr %0, %1" : "=r"(ret) : "i"(VX_CSR_WARP_ID));
    return ret;
 }

 // Return current core identifier
 inline int vx_core_id() {
    int ret;
-    asm volatile ("csrr %0, %1" : "=r"(ret) : "i"(VX_CSR_CORE_ID));
+    __asm__ volatile ("csrr %0, %1" : "=r"(ret) : "i"(VX_CSR_CORE_ID));
    return ret;
 }

 // Return active threads mask
 inline int vx_active_threads() {
    int ret;
-    asm volatile ("csrr %0, %1" : "=r"(ret) : "i"(VX_CSR_ACTIVE_THREADS));
+    __asm__ volatile ("csrr %0, %1" : "=r"(ret) : "i"(VX_CSR_ACTIVE_THREADS));
    return ret;
 }

 // Return active warps mask
 inline int vx_active_warps() {
    int ret;
-    asm volatile ("csrr %0, %1" : "=r"(ret) : "i"(VX_CSR_ACTIVE_WARPS));
+    __asm__ volatile ("csrr %0, %1" : "=r"(ret) : "i"(VX_CSR_ACTIVE_WARPS));
    return ret;
 }

 // Return the number of threads per warp
 inline int vx_num_threads() {
    int ret;
-    asm volatile ("csrr %0, %1" : "=r"(ret) : "i"(VX_CSR_NUM_THREADS));
+    __asm__ volatile ("csrr %0, %1" : "=r"(ret) : "i"(VX_CSR_NUM_THREADS));
    return ret;
 }

 // Return the number of warps per core
 inline int vx_num_warps() {
    int ret;
-    asm volatile ("csrr %0, %1" : "=r"(ret) : "i"(VX_CSR_NUM_WARPS));
+    __asm__ volatile ("csrr %0, %1" : "=r"(ret) : "i"(VX_CSR_NUM_WARPS));
    return ret;
 }

 // Return the number of cores per cluster
 inline int vx_num_cores() {
    int ret;
-    asm volatile ("csrr %0, %1" : "=r"(ret) : "i"(VX_CSR_NUM_CORES));
-    return ret;
-}
-
-// Return the number of barriers
-inline int vx_num_barriers() {
-    int ret;
-    asm volatile ("csrr %0, %1" : "=r"(ret) : "i"(VX_CSR_NUM_BARRIERS));
+    __asm__ volatile ("csrr %0, %1" : "=r"(ret) : "i"(VX_CSR_NUM_CORES));
    return ret;
 }

 // Return the hart identifier (thread id accross the processor)
 inline int vx_hart_id() {
    int ret;
-    asm volatile ("csrr %0, %1" : "=r"(ret) : "i"(VX_CSR_MHARTID));
+    __asm__ volatile ("csrr %0, %1" : "=r"(ret) : "i"(VX_CSR_MHARTID));
    return ret;
 }

 inline void vx_fence() {
-    asm volatile ("fence iorw, iorw");
+    __asm__ volatile ("fence iorw, iorw");
 }

 #ifdef __cplusplus