vortex/ci/trace_csv.py

#!/usr/bin/env python3

# Copyright © 2019-2023
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
# http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

import sys
import argparse
import csv
import re
import inspect

configs = None

class PerfCounter:
    def __init__(self, name):
        self.name  = name
        self.total = 0
        self.count = 0
        self.min   = 0
        self.max   = 0
        self.min_uuid = None
        self.max_uuid = None

    def update(self, uuid, value):
        if self.count != 0:
            if value < self.min:
                self.min = value
                self.min_uuid = uuid
            if value > self.max:
                self.max = value
                self.max_uuid = uuid
        else:
            self.min = value
            self.max = value
            self.min_uuid = uuid
            self.max_uuid = uuid
        self.total = self.total + value
        self.count = self.count + 1

    def dump(self):
        if self.count != 0:
            avg = self.total // self.count
        else:
            avg = 0
        print("{} latency: avg={}, min={} (#{}), max={} (#{})".format(self.name, avg, self.min, self.min_uuid, self.max, self.max_uuid))

def parse_args():
    parser = argparse.ArgumentParser(description='CPU trace log to CSV format converter.')
    parser.add_argument('-t', '--type', default='simx', help='log type (rtlsim or simx)')
    parser.add_argument('-o', '--csv', default='trace.csv', help='Output CSV file')
    parser.add_argument('log', help='Input log file')
    return parser.parse_args()

def load_config(filename):
    config_pattern = r"CONFIGS: num_threads=(\d+), num_warps=(\d+), num_cores=(\d+), num_clusters=(\d+), socket_size=(\d+), local_mem_base=0x([0-9a-fA-F]+), num_barriers=(\d+)"
    with open(filename, 'r') as file:
        for line in file:
            config_match = re.search(config_pattern, line)
            if config_match:
                config = {
                    'num_threads': int(config_match.group(1)),
                    'num_warps': int(config_match.group(2)),
                    'num_cores': int(config_match.group(3)),
                    'num_clusters': int(config_match.group(4)),
                    'socket_size': int(config_match.group(5)),
                    'local_mem_base': int(config_match.group(6), 16),
                    'num_barriers': int(config_match.group(7)),
                }
                return config
    print("Error: missing CONFIGS: header")
    sys.exit(1)

def parse_simx(log_lines):
    pipeline_pattern = r"TRACE\s+(\d+): pipeline-(schedule|ibuffer|dispatch|commit):.*#(\d+)"
    opcode_pattern = r"Instr: ([0-9a-zA-Z_\.]+)"
    pc_pattern = r"PC=(0x[0-9a-fA-F]+)"
    core_id_pattern = r"cid=(\d+)"
    warp_id_pattern = r"wid=(\d+)"
    tmask_pattern = r"tmask=(\d+)"
    operands_pattern = r"Src\d+ Reg: (.+)"
    destination_pattern = r"Dest Reg: (.+)"
    uuid_pattern = r"#(\d+)"
    entries = []
    instr_data = None
    schd_ticks = {}
    ibuf_ticks = {}
    disp_ticks = {}
    perf_sched = PerfCounter("Schedule")
    perf_issue = PerfCounter("Issue")
    perf_exec  = PerfCounter("Execute")
    for lineno, line in enumerate(log_lines, start=1):
        try:
            if line.startswith("DEBUG Instr:"):
                if instr_data:
                    entries.append(instr_data)
                instr_data = {}
                instr_data["lineno"] = lineno
                instr_data["opcode"] = re.search(opcode_pattern, line).group(1)
                instr_data["PC"] = re.search(pc_pattern, line).group(1)
                instr_data["core_id"] = int(re.search(core_id_pattern, line).group(1))
                instr_data["warp_id"] = int(re.search(warp_id_pattern, line).group(1))
                instr_data["tmask"] = re.search(tmask_pattern, line).group(1)
                instr_data["uuid"] = int(re.search(uuid_pattern, line).group(1))
            elif line.startswith("DEBUG Src"):
                src_reg = re.search(operands_pattern, line).group(1)
                instr_data["operands"] = (instr_data["operands"] + ', ' + src_reg) if 'operands' in instr_data else src_reg
            elif line.startswith("DEBUG Dest"):
                instr_data["destination"] = re.search(destination_pattern, line).group(1)
            elif line.startswith("TRACE"):
                line_match = re.search(pipeline_pattern, line)
                if line_match:
                    timestamp = int(line_match.group(1))
                    stage = line_match.group(2)
                    uuid = int(line_match.group(3))
                    if stage == "schedule":
                        schd_ticks[uuid] = timestamp
                    elif stage == "ibuffer":
                        ibuf_ticks[uuid] = timestamp
                        cycles = timestamp - schd_ticks[uuid]
                        perf_sched.update(uuid, cycles)
                    elif stage == "dispatch":
                        disp_ticks[uuid] = timestamp
                        cycles = timestamp - ibuf_ticks[uuid]
                        perf_issue.update(uuid, cycles)
                    elif stage == "commit":
                        cycles = timestamp - disp_ticks[uuid]
                        perf_exec.update(uuid, cycles)

        except Exception as e:
            print("Error: {}; {}".format(e, line))
            instr_data = None
    if instr_data:
        entries.append(instr_data)
    perf_sched.dump()
    perf_issue.dump()
    perf_exec.dump()
    return entries

def reverse_binary(bin_str):
    return bin_str[::-1]

def bin_to_array(bin_str):
    return [int(bit) for bit in bin_str]

def append_reg(text, reg, sep):
    if sep:
        text += ", "
    ireg = int(reg)
    rtype = ireg // 32
    rvalue = ireg % 32
    if (rtype == 2):
        text += "v" + str(rvalue)
    elif (rtype == 1):
        text += "f" + str(rvalue)
    else:
        text += "x" + str(rvalue)
    sep = True
    return text, sep

def reg_value(rtype, value):
    if rtype == 1:
        ivalue = int(value, 16)
        ivalue32 = ivalue & 0xFFFFFFFF
        return "0x{:x}".format(ivalue32)
    else:
        return value

def append_value(text, reg, value, tmask_arr, sep):
    text, sep = append_reg(text, reg, sep)
    ireg = int(reg)
    rtype = ireg // 32
    text += "={"
    for i in range(len(tmask_arr)):
        if i != 0:
            text += ", "
        if tmask_arr[i]:
            text += reg_value(rtype, value[i])
        else:
            text +="-"
    text += "}"
    return text, sep

def simd_data(sub_array, index, count, default=0):
    size = len(sub_array)
    total_subsets = count // size
    new_array = [default] * count
    start_index = index * size
    if start_index + size <= count:
        new_array[start_index:start_index + size] = sub_array
    return new_array

def merge_data(trace, key, new_data, mask):
    if key in trace:
        merged_data = trace[key]
        for i in range(len(mask)):
            if mask[i] == 1:
                merged_data[i] = new_data[i]
        trace[key] = merged_data
    else:
        trace[key] = new_data

def parse_rtlsim(log_lines):
    global configs
    line_pattern = r"(\d+):\s+cluster(\d+)-socket(\d+)-core(\d+)-(schedule|issue\d+-ibuffer|issue\d+-dispatch|commit):"
    pc_pattern = r"PC=(0x[0-9a-fA-F]+)"
    ex_pattern = r"ex=([a-zA-Z]+)"
    op_pattern = r"op=([\?0-9a-zA-Z_\.]+)"
    warp_id_pattern = r"wid=(\d+)"
    tmask_pattern = r"tmask=(\d+)"
    wb_pattern = r"wb=(\d)"
    used_rs_pattern = r"used_rs=(\d+)"
    sid_pattern = r"sid=(\d+)"
    rd_pattern = r"rd=(\d+)"
    rs1_pattern = r"rs1=(\d+)"
    rs2_pattern = r"rs2=(\d+)"
    rs3_pattern = r"rs3=(\d+)"
    rs1_data_pattern = r"rs1_data=\{(.+?)\}"
    rs2_data_pattern = r"rs2_data=\{(.+?)\}"
    rs3_data_pattern = r"rs3_data=\{(.+?)\}"
    rd_data_pattern = r"data=\{(.+?)\}"
    eop_pattern = r"eop=(\d)"
    uuid_pattern = r"#(\d+)"
    entries = []
    instr_data = {}
    num_cores = configs['num_cores']
    socket_size = configs['socket_size']
    num_threads = configs['num_threads']
    num_sockets = (num_cores + socket_size - 1) // socket_size
    schd_ticks = {}
    perf_sched = PerfCounter("Schedule")
    perf_issue = PerfCounter("Issue")
    perf_exec  = PerfCounter("Execute")
    for lineno, line in enumerate(log_lines, start=1):
        try:
            line_match = re.search(line_pattern, line)
            if line_match:
                PC = re.search(pc_pattern, line).group(1)
                warp_id = int(re.search(warp_id_pattern, line).group(1))
                tmask = re.search(tmask_pattern, line).group(1)
                uuid = int(re.search(uuid_pattern, line).group(1))
                timestamp = int(line_match.group(1))
                cluster_id = int(line_match.group(2))
                socket_id = int(line_match.group(3))
                core_id = int(line_match.group(4))
                stage = line_match.group(5)
                if re.match(r"schedule", stage):
                    schd_ticks[uuid] = timestamp
                elif re.match(r"issue\d+-ibuffer", stage):
                    trace = {}
                    trace["uuid"] = uuid
                    trace["PC"] = PC
                    trace["core_id"] = ((((cluster_id * num_sockets) + socket_id) * socket_size) + core_id)
                    trace["warp_id"] = warp_id
                    trace["tmask"] = reverse_binary(tmask)
                    trace["opcode"] = re.search(op_pattern, line).group(1)
                    trace["used_rs"] = bin_to_array(reverse_binary(re.search(used_rs_pattern, line).group(1)))
                    trace["rd"] = re.search(rd_pattern, line).group(1)
                    trace["rs1"] = re.search(rs1_pattern, line).group(1)
                    trace["rs2"] = re.search(rs2_pattern, line).group(1)
                    trace["rs3"] = re.search(rs3_pattern, line).group(1)
                    trace["ibuf_ticks"] = timestamp
                    instr_data[uuid] = trace
                    if uuid in schd_ticks:
                        ticks = schd_ticks[uuid]
                        cycles = (timestamp - ticks + 1) // 2
                        perf_sched.update(uuid, cycles)
                elif re.match(r"issue\d+-dispatch", stage):
                    if uuid in instr_data:
                        trace = instr_data[uuid]
                        sid = int(re.search(sid_pattern, line).group(1))
                        src_tmask_arr = simd_data(bin_to_array(tmask)[::-1], sid, num_threads, 0)
                        trace["lineno"] = lineno
                        used_rs = trace["used_rs"]
                        if used_rs[0]:
                            merge_data(trace, 'rs1_data', simd_data(re.search(rs1_data_pattern, line).group(1).split(', ')[::-1], sid, num_threads, '0x0'), src_tmask_arr)
                        if used_rs[1]:
                            merge_data(trace, 'rs2_data', simd_data(re.search(rs2_data_pattern, line).group(1).split(', ')[::-1], sid, num_threads, '0x0'), src_tmask_arr)
                        if used_rs[2]:
                            merge_data(trace, 'rs3_data', simd_data(re.search(rs3_data_pattern, line).group(1).split(', ')[::-1], sid, num_threads, '0x0'), src_tmask_arr)
                        trace["issued"] = True
                        trace["issue_ticks"] = timestamp
                        instr_data[uuid] = trace
                        cycles = (timestamp - trace["ibuf_ticks"] + 1) // 2
                        perf_issue.update(uuid, cycles)
                elif re.match(r"commit", stage):
                    if uuid in instr_data:
                        trace = instr_data[uuid]
                        if "issued" in trace:
                            sid = int(re.search(sid_pattern, line).group(1))
                            used_rs = trace["used_rs"]
                            dst_tmask_arr = simd_data(bin_to_array(tmask)[::-1], sid, num_threads, 0)
                            wb = re.search(wb_pattern, line).group(1) == "1"
                            if wb:
                                merge_data(trace, 'rd_data', simd_data(re.search(rd_data_pattern, line).group(1).split(', ')[::-1], sid, num_threads, '0x0'), dst_tmask_arr)
                            instr_data[uuid] = trace
                            eop = re.search(eop_pattern, line).group(1) == "1"
                            if eop:
                                tmask_arr = bin_to_array(trace["tmask"])
                                destination = ''
                                if wb:
                                    destination, sep = append_value(destination, trace["rd"], trace['rd_data'], tmask_arr, False)
                                    del trace['rd_data']
                                trace["destination"] = destination
                                operands = ''
                                sep = False
                                if used_rs[0]:
                                    operands, sep = append_value(operands, trace["rs1"], trace["rs1_data"], tmask_arr, sep)
                                    del trace["rs1_data"]
                                if used_rs[1]:
                                    operands, sep = append_value(operands, trace["rs2"], trace["rs2_data"], tmask_arr, sep)
                                    del trace["rs2_data"]
                                if used_rs[2]:
                                    operands, sep = append_value(operands, trace["rs3"], trace["rs3_data"], tmask_arr, sep)
                                    del trace["rs3_data"]
                                trace["operands"] = operands
                                cycles = (timestamp - trace["issue_ticks"] + 1) // 2
                                perf_exec.update(uuid, cycles)
                                del trace["ibuf_ticks"]
                                del trace["issue_ticks"]
                                del trace["used_rs"]
                                del trace["rd"]
                                del trace["rs1"]
                                del trace["rs2"]
                                del trace["rs3"]
                                del trace["issued"]
                                del instr_data[uuid]
                                entries.append(trace)
        except Exception as e:
            print("Error: {}; {}".format(e, line))
    perf_sched.dump()
    perf_issue.dump()
    perf_exec.dump()
    return entries

def write_csv(sublogs, csv_filename, log_type):
    with open(csv_filename, 'w', newline='') as csv_file:
        fieldnames = ["uuid", "PC", "opcode", "core_id", "warp_id", "tmask", "destination", "operands"]
        writer = csv.DictWriter(csv_file, fieldnames=fieldnames)
        writer.writeheader()

        for sublog in sublogs:
            entries = None

            # parse sublog
            if log_type == "rtlsim":
                entries = parse_rtlsim(sublog)
            elif log_type == "simx":
                entries = parse_simx(sublog)
            else:
                print('Error: invalid log type')
                sys.exit()

            # sort entries by uuid
            entries.sort(key=lambda x: (int(x['uuid'])))
            for entry in entries:
                del entry['lineno']

            for entry in entries:
                writer.writerow(entry)

def split_log_file(log_filename):
    with open(log_filename, 'r') as log_file:
        log_lines = log_file.readlines()

    sublogs = []
    current_sublog = None

    for line in log_lines:
        if line.startswith("[VXDRV] START"):
            if current_sublog is not None:
                sublogs.append(current_sublog)
            current_sublog = [line]
        elif current_sublog is not None:
            current_sublog.append(line)

    if current_sublog is not None:
        sublogs.append(current_sublog)
    else:
        sublogs.append(log_lines)

    return sublogs

def main():
    global configs
    args = parse_args()
    configs = load_config(args.log)
    sublogs = split_log_file(args.log)
    write_csv(sublogs, args.csv, args.type)

if __name__ == "__main__":
    main()